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JC| (54) Title: TUBULYSIN BIOSYNTHESIS GEN E 

^ (54) Bezeichnung: TUBULYSIN-BIOSYNTHESE-GENE 

^ (57) Abstract : The invention relates to an ss-DNA molecule, a ds-DNA molecule, an RNA, a vector, the use of the same, and a cell, 
fSI especially for expressing tubulysin genes. 



(57) Zusammenfassung: Die Erfindung betrifft ein ss-DNA-Molekiil, ein ds-DNA-Molekul, eine RNA, einen Vektor, dessen Ver- 
wendung sowie eine Zelle, insbesondere zur Expression von Tubulysin-Genen. 

Express Mail No. 
EV195875530US 



• 4. 



WO 2004/022586 ^^ > CT/EP2003/009780 



.Gesellschaft fur Biotechnologische Forschung mbH 



Tubu lysin-Bio syn the s e - Gene 

Tubulysine sind bereits als eine neue, auf das Tubulin-Skelett 
wirkende Substanzf amilie aus Myxobakterien in Irsee vorgestellt 
worden; vgl. PCT/EP 97/05095 und DE 100 08 08 9.8 und die darin 
angefiihrte Literatur. Im Gegensatz zu den Epothilonen zeigen 
diese eine mikrotubuli-abbauende Wirkung sowie die vermehrte 
Ausbildung von Zentrosomen. Mit einer Cytotoxizitat von IC 50 = 
10 - 500 pg sind die Tubulysine als potentielle Cytostatika von . 
besonderem Interesse. 

Die Tubulysine haben eine cytostatische oder antimitotische 
Wirkung auf Pilze, humane Tumore oder Krebszellinien und andere 
tierische Zellkulturen (vgl/ Tabelle) . Sie fUhren in den Zellen 
zu einem raschen Abbau des Mikrotubuli-Gerusts . Das Aktinskelet.t 
bleibt erhalten. Adharent wachsende L929-Maus-Zellen vergrofiern 
unter dem Einfluii der Tubulysine ihr Zellvolumen, ohne sich zu 
teilen, und entwickeln groBe Zellkerne, die dann in einem 
apoptischen Vorgang zer fallen. 



Express Mai] No, 
EV195875530US 



WO 2004/022586 ^^CT/EP2003/009780 



Wirkunsspektrum 



Pilze 



Aspergillus niger 
Botrytis cineria 
Coprinus cinereus 
Pythinum debaryanum 



Hemmhof [mm] 



Tubulysin A Tubulysin B 



20 
23 
20 
20 



18 
18 



Agardif fusiontest : 20 ug pro Testblattchen 6 ram Durchmesser 



Humane Krebszellinine 



KB-3-1 

(DSM ACC 158) 
K-562 

(ATCC CCL 243) 
HL-60 

(ATCC-CCL 24 0) 



0,1 
0,04 



IC 5 q [ng/ml] 



Tubulysin A Tubulysin B Tubulysin C 
0,01 0,02 0,1 



0,2 
0,08 



1,5 
0,4 



Tierische Zellinien 



L929, Maus 0,2 0,4 2 

(ATCC CCL1) 



Pt K2, Potorous tri- 

dactylis 

(ATCC CCL 56) 



0,2 



0,2 



2 
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Gemafi einer Ausf uhrungsf orm betrifft die Erfindung ein ss-DNA- 
Molekul, ausgewahlt aus der folgenden Gruppe: 

ss-DNA-Molekul mit einer Sequenz gemafi. Figur 1; ; „ 

ss-DNA-Molekul, das mit einem ss-DNA-Molekul gemafi (i); 
hinsichtlich seiner Nucleotid-Anzahl oder seiner 
Nucleotid-Sequenz zu jeweils 90, 91, 92., 93, 94, 95, 
96, 97, 98, 99 oder 100% homolog ist, jedoch von dem 
ss-DNA-Molekul gemaB (i) hinsichtlich seiner 
Nucleotid-Anzahl . und/oder seiner Nucleotid-Sequen? in 
mindestens einem Nucleotid abweicht; und 

ss-DNA-Molekul mit einer Sequenz, die zur Sequenz 
eines ss-DNA-Molekuls gemafi (i) oder (ii) komplementar 
ist . 

Ferner betrifft die Erfindung ein ds-DNA-Molekul aus einem 
erf indungsgemafien ss-DNA-Molekul .und einem dazu komplementaren 
Strang. 

Gemafi einer- weiteren Ausf uhrungsf orm betrifft die Erfindung ein 
ss-DNA-Molekul, ausgewahlt aus der folgenden Gruppe: 

(i) ss-DNA-Molekul mit einer Sequenz der Positionen 3.308 
bis 1 (ORF 16) der Sequenz gemafi Figur 1; 

(ii) ss-DNA-Molekiil mit einer Sequenz der Positionen 4706 
bis 3453 (ORF 15) der Sequenz gemafi Figur 1; 



(i) 
(ii) 



(iii) 



ss-DNA-Molekiil mit einer Sequenz der Positionen 5719 
bis 7164 (ORF 14) der Sequenz gemafi Figur 1; 



WO 2004/022586 




CT/EP2003/009780 



(iv) ss-DNA-Molekul mit einer Sequenz der Positionen 9557 
bis 7317 (ORF 13) der Sequenz gemafi Figur 1; 

( v ) ss-DNA-Molekiil mit einer Sequenz der Positionen 12193 
bis 10550 (ORF 12) der Sequenz gemafi Figur 1; 

(vi) ss-DNA-Molekiil mit einer Sequenz der Positionen 12841 
bis 13881 (ORF 11) der Sequenz gemafi Figur 1; 

(vii) ss-DNA-Molekiil mit einer Sequenz der Positionen 14833 
bis 13835 (ORF 10) der Sequenz gemafi Figur 1; 

(viii) ss-DNA-Molekul mit einer Sequenz der Positionen 14 942 
bis 15586 (ORF 9) der Sequenz gemafi Figur 1; 

(ix) ss-DNA-Molekul mit einer Sequenz der Positionen 15847 
bis 16983 (ORF 8) der Sequenz gemafi Figur 1; 

(x) ss-DNA-Molekul mit einer Sequenz der Positionen 21154 
bis 18809 (ORF 7) der Sequenz gemafi Figur 1; 

(xi) ss-DNA-Molekul mit einer Sequenz der Positionen 22366 
bis 23532 (ORF 6) der Sequenz gemafi Figur 1; 

(xii) ss-DNA-Molekul mit einer Sequenz der Positionen 24591 
bis 26513 (ORF 5) der Sequenz gemafi Figur 1; 



(xiii) 



ss-DNA-Molekul mit einer Sequenz der Positionen 2 6597 
bis 27517 (ORF 4) der Sequenz gemafi Figur 1; 
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(xiv) ss-DNA-Molekul mit einer Sequenz der Positioner! 29858 

bis 30400 (ORF 3) der Sequenz gemafi Figur 1; 



(xv) 



ss-DNA-Molekiil mit einer Sequenz der Positionen 31220 
bis 32392 (TubA) der Sequenz gemafi Figur 1; 



(xvi) ss-DNA-Molekiil mit einer Sequenz der Positionen 33056 
bis 32397 (ORF 2) der Sequenz gemafi Figur 1; 

(xvii) ss-DNA-Molekiil mit einer Sequenz der Positionen 34195 
bis 33074 (TubZ) der Sequenz gemafi Figur 1; 

(xviii) ss-DNA-Molekiil mit einer Sequenz der Positionen 35422 
bis 34205 (ORF 1) der Sequenz gemafi Figur 1; 

(xix) ss-DNA-Molekul mit einer Sequenz der Positionen 35522 
bis 40147 (TubB) der Sequenz gemafi Figur 1; 



(xx) 



ss-DNA-Molekul mit einer Sequenz der Positionen 40144 
bis 48021 (TubC) der Sequenz gemafi Figur 1; 



(xxi) ss-DNA-Molekiil mit einer Sequenz der Positionen 48011 

bis 58558 (TubD) der Sequenz gemafi Figur 1; 



(xxii) ss-DNA-Molekiil mit einer Sequenz der Positionen 58551 
bis 62096 (TubE) der Sequenz gemafi Figur 1; 



(xxiii) ss-DNA-Molekiil mit einer Sequenz der Positionen 62103 
bis 70616 (TubF) der Sequenz gemafi Figur 1; 



(xxiv) ss-DNA-Molekiil, das mit einem Molekul gemafi (i) , (ii) 
(iii), (iv), (v), (vi), (vii) , (viii) , (ix) , (x) , 
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(xi), (xii), (xiii), (xiv) , (xv), (xvi) , (xvii) , 
(xviii), (xix), (xx) , (xxi), (xxii) oder (xxiii) unter 
stringenten Bedingungen hybridisierbar ist und 
insbesondere dieselbe Anzahl von Basen aufweist; und 

ss-DNA-Molekul, das mit einem ss-DNA-Molekiil gemaB 
(i) , (ii), (iii), (iv) , (v) , (vi) , (vii) , (viii) , 
(ix), (x) , (xi) , ,(xii) , .(xiii), (xiv), (xv) , (xvi)., 
(xvii), (xviii), (xix), (xx) , (xxi), (xxii) oder 
(xxiii) hinsichtlich seiner Nucleotid-Anzahl oder 
seiner Nucleotid-Sequenz zu jeweils 90, 91, 92, 93, 
94, 95, 96, 97, 98, 99 oder 100% homolog ist, jedoch 
von diesem ss-DNA-Molekiil hinsichtlich seiner : 
Nucleotid-Anzahl und/oder seiner Nucleotid-Sequenz in 
mindestens einem Nucleotid abweicht; und 

■ ■ - . 

ss-DNA-Molekul mit einer Sequenz, die zur Sequenz 
eines Molekuls gemaB (i) , (ii) , (iii) , (iv) , (v) , 
(vi), (vii), (viii), (ix), (x) , (xi) , (xii), (xiii), 
(xiv), (xv), (xvi), (xvii), (xviii), (xix), (xx) , 
(xxi), (xxii), (xxiii), (xxiv) oder (xxv) komplementar 
ist . 

Ferner betrifft die Erfindung ein ds-DNA-Molekal aus einem 
derartigen erf indungsgemaBen ss-DNA-Molekul und einem dazu 
komplementaren Strang. 

GemaB einer weiteren Ausf uhrungsf orm betrifft die Erfindung ein 
ss-DNA-Molekai, ausgewahlt aus der folgenden Gruppe: 



(xxv) 



(xxvi) 
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(i) ss-DNA-Molekul mit einer' Sequeriz der Positionen 35747 
bis 36769 (Domane C des tubB-Gens) der Sequenz gemaB 
Figur 1; 

(ii) ss-DNA-Molekul mit einer Sequeriz der Positionen 37184 
bis 39817 (Domane A des tubB-Gens) der Sequenz gemaft 
Figur 1; 

(iii) ss-DNA-Molekul mit einer Sequenz der Positionen 38369 
bis 39730 (Domane NMT des tubB-Gens) der Sequenz gemali 
Figur 1; 



(iv) ss-DNA-Molekul mit einer Sequenz der Positionen 39818 
bis 40069 (Domane PCP des tubB-Gens) der Sequenz gemafi 
Figur 1; 

(v) ss-DNA-Molekul mit einer Sequenz der Positionen 40372 
bis 41397 (Domane C des tubC-Gens) der Sequenz gemali 
Figur 1; 

(vi) ss-DNA-Molekul mit einer Sequenz der Positionen 41824 
bis 43215 (Domane A des tubC-Gens) def ^Sequenz gemaiJ 
Figur 1; 

(vii) ss-DNA-Molekul mit einer Sequenz der Positionen 4 3216 
bis 43461 (Domane PCP des tubC-Gens) der Sequenz gemali 
Figur 1; 



(viii) 



ss-DNA-Molekttl mit einer Sequenz der Positionen 43552 
bis 44574 (Domane C des tubC-Gens) der Sequenz gemafj 
Figur 1; 
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(ix) ss-DNA-Molekiil mit einer Sequenz der Positionen 44980 
bis 47631 (Domane A des tubC-Gens) der Sequenz gemafi 
Figur 1; 

(x) ss-DNA-Molekiil mit einer Sequenz der Positionen 46153 
bis 47547 (Domane NMT des tubC-Gens) der Sequenz gemafi 
Figur 1 ; 

(xi) ss-DNA-Molekul mit einer Sequenz der Positionen 47632 
bis 47868 (Domane PCP des tubC-Gens) der Sequenz gemafi 
Figur 1; 

(xii) ss-DNA-Molekul mit einer Sequenz der Positionen 48011 
bis 4 9321 (Domane KS des tubD-Gens) der Sequenz gemafi 
Figur 1; 

(xiii) ss-DNA-Molekul mit einer Sequenz der Positionen 49622 
bis 50584 (Domane AT .des tubD-Gens) der Sequenz gemafi 
Figur 1 / 

(xiv) ss-DNA-Molekul mit einer Sequenz der Positionen 51473 
bis 52309 (Domane KR des tubD-Gens) der Sequenz gemafi 
Figur 1; 

(xv) ss-DNA-Molekul mit einer Sequenz der Positionen 53066 
bis 53980 (Domane ER des tubD-Gens) der Sequenz gemafi 
Figur 1; 

(xvi) ss-DNA-Molekiil mit einer Sequenz der Positionen 54158 
bis 54460 (Domane ACP des tubD-Gens) der Sequenz gemafi 
Figur 1; 
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(xvii) ss-DNA-Molekiil mit einer Sequenz der Positionen 54461 
bis 55870 (Domane HC des tubD-Gens) der Sequenz gemali 
Figur 1; 

(xviii) ss-DNA-Molekiil mit einer Sequenz der Positionen 56000 
bis 57412 (Domane A des tubD-Gens) der Sequenz gemali 
Figur 1; 

(xix) ss-DNA-Molekiil mit einer Sequenz der Positionen 57413 
., bis 57643 (Domane PCP des tubD-Gens )"' der Sequenz gemali 

Figur 1; 

(xx) ss-DNA-Molekiil mit einer Sequenz der Positionen 58689 
bis .59714 (Domane C des tubE-Gens) der Sequenz gemafi 
Figur 1; 

(xxx) ss-DNA-MolekUl mit einer Sequenz der Positionen 60156 

bis 61697 (Domane A des tubE-Gens) der Sequenz gemali 
Figur 1; 

(xxii) ss-DNA-Molekiil mit einer Sequenz der Positionen 61698 
bis 61967 (Domane, PCP des tubE-Gens) der Sequenz gemafi 
Figur 1; 

(xxiii) ss-DNA-MolekOl mit einer Sequenz der Positionen 62127 
bis 63320 (Domane KS des tubF-Gens) der Sequenz gemaB 
Figur 1 ; 



(xxiv) 



ss-DNA-Molekiil mit einer Sequenz der Positionen 63711 
bis 64 676 (Domane AT des tubF-Gens) der Sequenz gemaB 
Figur 1; 
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(XXV) 



ss-DNA-Molekul. mit einer Sequenz der Positionen 64959 
bis 65882 (Domane KR des tubF-Gens) der Sequenz gemafi 
Figur 1; 



(xxvi) 



ss-DNA-Molekul mit einer Sequenz der Positionen 65985 
bis 67061 (Domane CMT des tubF-Gens) der Sequenz gemafi 
Figur 1; 



(xxvii) 



ss-DNA-Molekul mit einer Sequenz der Positionen 67242 
bis 67829 (Domane DH des tubF-Gens) der Sequenz gemSli 
Figur 1; 



(xxviii) 



ss-DNA-Molekul mit einer Sequenz der Positionen 68247 
bis 69128 (Domane ER des tubF-Gens) der Sequenz gemafi 
Figur 1; 



(xxix) 



ss-DNA-Molekul mit einer Sequenz der Positionen 69360 
bis 69605 (Domane PCP des tubF-Gens) der Sequenz gemafi 
Figur 1; 



(xxx) 



ss-DNA-Molekul mit einer : Sequenz der Positionen 69759 
bis 70586 . (Domane TE des - tubF-Gens) der Sequenz gemafi 
Figur 1; 



(xxxi) 



ss-DNA-Molekul, das mit einem Molekul gemafi (1), (ii) , 
(iii), (iv), (v), (vi), (vii)., (viii), (ix), ( X ), 
(xi), (xii), (xiii), (xiv), (xv), (xvi), (xvii), 
(xviii), (xiv), (xx), (xxi), (xxii), (xxiii), (xxiv), 
(xxv), (xxvi), (xxvii), (xxviii), (xxix) oder (xxx) 
unter stringenten Bedingungen hybridisierbar ist und 
insbesondere dieselbe Anzahl von Basen aufweist; 
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(xxxii) 



(xxxiii) 



ss-DNA-Molekiil, das mit einem Molekul gemafc (i) , (ii), 
(iii), (iv), (v), (vi), (vii), (viii), (ix) , (x) , 
<xi), (xii), (xiii), (xiv), (xv) , (xvi) , (xvii) , 
(xviii), (xiv), (xx), (xxi), (xxii) , (xxiii) , (xxiv) , 
(xxv), (xxvi), (xxvii), (xxviii), (xxix) oder (xxx) 
hinsichtlich seiner Nucleotid-Anzahl oder seiner 
Nucleotid-Sequenz zur jeweils 90, 91, 92, 93, 94, 95, 
96, 97, 9,8, 99 oder 100% hornolog ist, jedoch von 
diesem ss-DNA-Molekul hinsichtlich seiner Nucleotid- 
Anzahl und/oder seiner Nucleotid-Sequenz in mindestens 
einem Nucleotid abweicht; und 




Ferner betrifft die Erfindung ein ds-DNA Molekul aus einem 
derartigen ss-DNA-MolekUl und einem dazu komplementarem Strang. 

Ferner betrifft die Erfindung Varianten oder Mutanten, die aus 
einer Substitution, Insertion oder Deletion von Nucleotiden oder 
einer Inversion von Nucleotid-Segmenten eines erf indungsgemaften 
ss-DNA-Molekiils oder eines erf indungsgemafien ds-DNA-Molekiils 
resultieren, wobei diese Varianten und Mutanten Enzym-Varianten 
Oder Enzym-Mutanten fur die Produktion von Sekundarstof f (en) mit 
den eingangs geschilderten und fur Tubulysine charakteristischen 
Eigenschaften codieren, insbesondere mit der cytostatischen 
Wirkung. Der Fachmann ist mit Massenscreening vertraut. 
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Ferner betrifft die Erfindung RNA 

(a) mit einer Sequenz entsprechend der eines erf indungsgemalien 

ss-DNA-Molekuls oder 
<b) mit einer Sequenz einer RNA gemali (a) , aber in 

Gegenrichtung (anti-sense), oder 
(c) mit einer Sequenz einer RNA gemali (a) oder (b) und mit 

einem dazu komplementaren Strang, 
jeweils gegebenenfalls als Element eines rekombinanten Vektors. 

Gemali einer weiteren Ausfuhrungsform betrifft die Erfindung 
einen rekombinanten Vektor, insbesondere Expressionsvektor mit 
einem erf indungsgemalien DNA-Molekul. 

Gemali einer weiteren Ausfuhrungsform betrifft die Erfindung eine 
Zelle, insbesondere zur Expression, in die ein erf indungsgemalies 
DNA-Molekul oder ein erf indungsgemalier Vektor integriert ist. 

Die erfindungsgemalie Zelle kann sich von kultivierbaren 
Bakterien wie Myxobakterien wie Angiococcus, insbesondere A. 
disciformis, Archangium, insbesondere A. gephyra/ Escherichia 
coli, Pseudomonaden oder Actimomyceten herleiten. 

Gemali einer weiteren Ausfuhrungsform betrifft die Erfindung eine 
Verwendung eines erf indungsgemalien Vektors far die 
Transformation von Zellen oder Organismen zur transienten oder 
permanenten Expression eines oder mehrerer Proteine 
(Expressionsprodukt(e)), das (die) durch eine DNA (ssDNA oder 
dsDNA) des Vektors codiert wird (werden) . 

Gemali eine weiteren Ausfuhrungsform betrifft die Erfindung eine 
Verwendung einer erf indungsgemalien Zelle zur enzymatischen 
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Biosynthese, Mutasynthese Oder Partial-Synthese eines 
Tubulysins, insbesondere Tubulysin A, B, C, D, E und/oder F. 

GemafJ einer weiteren Ausf iihrungsf orm betrifft die Erfindung ein 
Expressionsprodukt eines erf indungsgemafien DNA-Molekuls oder 
eines erf indungsgemaften Vektors oder einer erfindungsgemalien 
Zelle. 



Die vorliegende Erfindung betrifft insbesondere ein 
Polynucleotid, das eine Sequenz wie .in SEQ ID NO: 1, 18, 33 oder 
36 definiert, oder ein Fragment davon enthalt. SEQ ID NO: 1 und 
18 beschreiben den (+)- bzw. den (-) -Strang des Tubulysin 
Biosynthese-Clusters von Angiococcus discif ormis . SEQ ID NO: 33 
ist eine Sequenz, die mehrere sich uberlappende Gene des 
Clusters enthalt. SEQ ID NO: 36 beschreibt eine Mutante von 1 
Angiococcus discif ormis. Oberraschenderweise wurde gefunden, 
dass diese Mutante ein Vielf aches der Tubulysin D-Produktion des 
Wildtyps zeigte. Die Tubulysin-Oberexpression ist auf die 
Gesamtwirkung aller Tubulysin-Derivate bezogen sogar noch hoher 
als die von Tubulysin D, was in keinsterweise zu erwarten war. 
Die Gene der SEQ ID NO: 36 sind offenbar an der negativen 
Regulation der Tubulysin Expression beteiligt. Diese Mutante ist 
auf Grund der erhohten Expression aller Tubulysine besonders 
geeignet zur Produktion der erf indungsgemafien Polypeptide. 
Antikorper gegen die Wildtyp-Expressionsprodukte dieser Sequenz 
konnen eingesetzt werden, urn deren negativen Einfluss auf die 
Tubulysin Produktion auch in anderen Stammen zu minimieren. 
Einen ahnlichen Effekt hben auch antisense-RNA bzw RNAi- 
Techniken, die mit der Wildtyp Sequenz der negativen 
Regulatorgene interagieren . 



WO 2004/022586 



14 



CT/EP2003/009780 



Die Fragment e des Polynucleotid konnen jede beliebige 
Teilsequenz und Lange haben, bevorzugt sind jedoch solche 
Fragmente, die Proteine codieren. Die Polynucleotide der 
vorliegenden Erfindung schlieflen ebenfalls ein, sind jedoch > 
nicht beschrankt auf, ein Polynucleotid/ das an den 
komplementaren Strang der offenbarten Nucleotidsequenzeri unter 
moderat stringenten oder stringenten Bedingungen hybridisiert ; 
ein Polynucleotid, das eine Allel-Variante irgendeines oben 
beschriebenen Polynucleotids ist; ein Polynucleotid, das ein 
Spezies-Homolog irgendwelcher der hier offenbarten Proteine 
codiert; oder ein Polynucleotid, das ein Polypeptid codiert, das 
eine zusatzliche spezifische Domane oder eine Trunkierung bzw. 
Verkiirzung der offenbarten Proteine aufweist. 

Der Begriff "CDS" bzeichnet eine Sequenz von Nucleotiden, die 
der Sequenz von Aminosauren in einem Protein entspricht, also 
die Aminosauren-codierenden Sequenzbereiche , inklusive des 
jeweiligen Start- und Stoppcodons. 

In einer bevorzugten Ausf tihrungsf orm ist das erfindungsgemSfie 
Polynucleotid ein Fragment, das eine im Sequenzprotokoll 
definierte CDS ist. 

Die vorliegende Erf indung betrif f t weiterhin einen Vektor, der 
ein Polynucleotid wie oben beschrieben enthalt. Vektoren fur 
verschiedene Zwecke sind im Stand der Technik bek'annt, ebenso 
die Techniken zur Subklonierung von Polynucleotiden in solche 
Vektoren. Diese werden beispielsweise in der neuen Ausgabe von 
Molecular Cloning: A Laboratory Manual, (Sambrook et al . , (1989) 
Molecular Cloning: A Laboratory Manual, 2nd ed. , Cold Spring 
Harbor Laboratory Press); DNA Cloning, Volumes I and II (D. N. 
Glover ed. , 1985); Gene Transfer Vectors for Mammalian Cells 
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{Miller & Calos, eds .); Current Protocols in Molecular Biology 
and Short Protocols in Molecular Biology, 3rd Edition (F. M. 
Ausubel et al . , eds. ) ; Recombinant DNA' Methodology (R. Wu ed . , 
Academic Press) oder "A Practical Guide T6 Molecular Cloning" 
beschrieben. Beispiele fur Vektorerv finder! sich unter anderen in 
Gene Transfer Vectors For Mammalian Cells <J. H. Miller and M. 
P. Calos eds., 1987, Cold Spring Harbor Laboratory) . 

Bei dem Vektor handelt es sich vorzugsweise urn einen 
Expressionsvektor, also im Allgemeinen ein Plasmid, einen 
Phagen, ein Virus oder einen Vektor zum Exprimieren eines 
Polypeptide aus. einer DNA (RNA) Sequenz. Ein Expressionsvektor 
kann eine Transkriptionseinheit umfassenv die eine Anordnung des 
Folgenden aufweist: (1) ein genetisches Element oder Elemente 
mit einer regulatorischen Rolle in der Genexpression, 
beispielsweise Promotoren oder Enhancer, (2) eine 
Struktursequenz oder codiefende Sequenz/ die in mRNA 
trans kribiert und in ein Protein translatiert wird und (3) 
geeignete Transkriptionsstart- und -terminationssequenzen . 
Struktureinheiten, die zur Verwendung in He fen oder 
eukaryontischen Expressipnssystemen vorgesehen sind, schlielien 
vorzugsweise eine Leadersequenz ein, die' die extrazellulare 
Sekretion eines translatierten Proteins durch einen Wirt 
ermbglicht. :Es kann alternativ, wenn ein rekombinantes Protein 
ohne eine Leader- oder Transportsequenz exprimiert wird, einen 
N-terminalen Methionin-Rest einschlielien. Dieser Rest kann, muss 
aber nicht anschliefiend von dem exprimierten rekombinanten 
Protein abgespalten werden, um das Endprodukt zu erhalten. 

Des Weiteren betrifft die vorliegende Erfindung eine Zelle, die 
einen solchen Vektor enthalt. Der Vektor kann aber die bekannten 
Techniken wie beispielsweise Transf ektion, Elektroporation, 
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Lipofektion usw. in die Zelle eingebracht werden. Bei viralen 
Vektoren ist auch eine Infektion moglich. Bei den Zellen kann es 
sich urn eukaryotische als auch prokaryot ische Zellen handeln. 
Auch die Methoden zur Selektion und Propagierung der Zellen, die 
den Vektor enthalten sind dem Fachmann bekannt. Beispiele fur 
die Kultivierung von Zellen tierischen Ursprungs sind u. a. in 
Culture Of Animal Cells (R. I . Freshney, Alan R. Liss, Inc./ 
1987) zu finden. 

Eine weitere Ausf uhrungsf orm betrifftein Polypeptid, das 
wenigstens eine Sequenz wie in, SEQ ID NO: 2 bis 17, 19 bis 32, 
34, 35, 37 und/oder 38 definiert und/oder ein Fragment und/oder 
Deri vat davon enthalt. Das Polypeptid kann sowohl durch 
Expression eines Polynucleotids als auch durch chemische 
Synthese bereitgestellt werden. 

Die Aminosauresequenzen der vorliegenden Erfindung umfassen 
ebenfalls alle Sequenzen, die sich von den hier offenbarten 
Sequenzen durch Aminosaureinsertionen, -deletionen und - 
substitutionen unterscheiden. 

Aminosaure- .Substitutionen" sind vorzugsweise das Ergebriis des 
Ersetzens einer Aminosaure durch eine andere Aminosaure mit 
ahnlichen strukturellen und/oder chemischen Eigenschaften, das 
heiBt konservative Aminosaure-Austausche. Aminosaure- 
Substitutionen konnen auf der Grundlage einer Ahnlichkeit in der 
Polaritat, Ladung, LSslichkeit, Hydrophobie, Hydrophilie 
und/oder der amphipatischen Natur der einbezogenen Reste 
vorgenommen werden. Beispielsweise schliefien unpolare 
(hydrophobe) Aminosauren Alanin, Leucin, Isoleucin, Valin, 
Prolin, Phenylalanin, Tryptophan und Methionin ein; polare 
neutrale Aminosauren schliefien Glycin, Serin, Threonin, Cystein, 
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Tyrosin, Asparagin und Glutamin ein; positiv geladene (basische) 
Aminosauren schliefien Arginin, Lysin und Histidin ein; und 
negativ geladene (saure) Aminosauren schlieften Asparaginsaure 
und Glutaminsaure ein. • ,.. 

"Insertionen" oder "Deletionen" bewegen sich typischerweise im 
Bereich von 1-3 Aminosauren. Die erlaubte Variation kanri 
experimentell bestimmt werden, indem systematise!* Insertionen, 
Deletionen oder Substitutionen von Aminosauren in einem 
Polypeptidmolekul unter Verwendung von DNA- 

Rekombinationstechniken vorgenommen und die sich ergebenden 
rekombinanten Varianten beziiglich ihrer Aktivitat uritersucht 
werden. Dazu ist fur den Faehmann nieht mehr als die 
Durchftihrung von Routineexperimenten erf orderlich . 

Beispielsweise kann das Polypeptid auch in Form eine s chimaren 
Polypeptids, codiert duroh ein Fusionsgens, vorliegen, dass 
wenigstens eine weitere Sequenz enthalt. Diese zusatzliche 
Sequenz kann z.B. dazu dienen, die Aufreinigung des 
Bxpressionsprodukts zu erleichtern oder dem Expressionsprodukt 
eine zusatzlich Funktion zu verleihen. 

Beispiele fur zusatzliche Sequenzen/ die die Aufreinigung 
erleichtern sind sogenannte Tags, die dem Faehmann bekannt sind, 
wie z.B. das his-tag. 

Die vorliegende Erfindung betrifft aufierdem die Verwendung 
wenigstens eines Polynucleotids wie in SEQ ID NO: 1, 18, 33 
und/oder 36 definiert und/oder wenigstens eines Fragments davon 
und/oder wenigstens eines Polypeptids wie in SEQ ID NO: 2 bis 
17, 19 bis 32, 34, 35, 37 und/oder 38 definiert und/oder 
wenigstens eines Fragments davon zur Herstellung einer 
pharmazeutischen Zusammensetzung zur Behandlung von 
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unerwunschtem Zellwachstums oder unerwtoschter Zellvermehrung in 
einem Individuum. Die Zusammensetzung kann beispielsweise einen 
geeigneten Vektor enthalten, zusammen mit Hilf sf aktoren, die die 
Expression eines Tubulysins, vorzugsweise in den unerwtinschten 
Zellen, ermoglichen und dadurch ein weiteres Wachstum bzw . eine 
weiter Vermehrung dieser Zellen verhindern. Die Zusammensetzung 
kann auch erf indungsgemafie Zellen enthalten, die mit einem 
Vektor, beispielweise einen Tubulysin-exprimierenden Vektor, 
transfiziert wurden. 

In einer bevorzugten Ausf iihrungsf orm ist das unerwuhschte 
Zellwachstum oder die unerwunschte Zellvermehrung ein Tumor: Der 
Tumor kann sowohl eine gutartige als auch eine bosartige 
Geschwulst sein. 

In einer weiteren Ausftihrungsform ist das unerwunschte 
Zellwachstum eine pathogene Infektion. Das Pathogen kann hierbei 
sowohl einzellig als auch mehrzellig sein. Dies schlieBt auch 
Infektionen mit Pilzen, wie beispielsweise Candida oder 
Aspergillus, und Infektionen mit Parasiten, wie beispielweise 
Trypanosomen oder Schistosomen ein. In einer bevorzugten 
Ausfiihrungsform der Verwendung ist die pathogene Infektion eine 
Mykose, Malaria oder eine parasitare Erkankung. 

Die Erfindung betrifft ferner eine pharmazeutische 
Zusammensetzung, enthaltend wenigstens ein Polynucleotid wie in 
SEQ ID NO: 1, 18, 33 und/oder 36 definiert und/oder wenigstens 
ein Fragment davon und/oder wenigstens ein Polypeptid wie in SEQ 
ID NO: 2 bis 17, 19 bis 32, 34, 35, 37 und/oder 38 definiert 
und/oder wenigstens ein Fragment davon. Die Zusammensetzungen 
enthalten eine therapeutisch wirksame Menge bzw. Dosis des 
jeweiligen Wirk- bzw. Inhaltsstof f es . Eine therapeutisch 
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wirksame Dosis betrifft diejenige Menge der Verbindung, die 
ausreicht, um eine Linderung der Symptome, beispielsweise eine 
Behandlung, Heilung, Prevention oder Linderung derartiger 
Zustande, insbesondere die Hemmung oder Verhinderung von 
unerwunschtem Zellwachstum und Zellvermehrung in einem Patienten 
zu ergeben. Geeignete Verabreichungswege schliefien 
beispielsweise eine parenterale Verabreichung, einschliefilich 
intramuskularer und subkutaner Injektionen, ebenso wie 
intrathekaler, direkt intraventrikularer, intravendser , 
intraperitonealer Injektionen ein. 

In einer weiteren Ausf uhrungsf orm enthalt diese pharmazeutische 
Zusammensetzung wenigstens einen pharmazeutisch vertraglichen 
Tragerstoff . Eine solche Zusammensetzung kann weiterhin 
(zusatzlich zum Inhaltsstoff und dem TrSger) VerdQnnungsmittel, 
FOllmittel, Salze, Puffer> Stabilisatoren, Ldsungsvermittler und 
andere Materialien enthalten, die im Stand der Technik wohl 
bekannt sind. Der Begriff "pharmazeutisch vertraglich" bedeutet 
ein nicht-toxisches. Material, das die Wirksamkeit der 
biologischen Aktivitat des aktiven Inhaltsstoff (der aktiven 
Inhaltsstoffe) nicht stort. Die Eigenschaf ten des Tragers hangen 
vom Verabreichungsweg ab. Die therapeutische Zusammensetzung 
kann weiterhin weitere Mittel bzw. Wirkstoffe enthalten, die die 
Aktivitat bzw. Wirksamkeit oder Anwendung bei Behandlung 
verbessern bzw. erleichtern. Solche zusatzlichen Faktoren 
und/oder Mittel konnen in der therapeutischen Zusammensetzung 
enthalten sein, um eine synergistische Wirkung zu erzeugen oder 
um Nebenwirkungen zu minimieren. 

Techniken zur Formulierung, Zubereitung und Verabreichung der 
Verbindungen der vorliegenden Erfindung sind in "Remington's 
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Pharmaceutical Sciences", Mack Publishing Co., Easton, PA, 
neueste Ausgabe, zu finden. 

Die vorliegende Erfindung. betrifft aulierdem ein Verfahren zur, 
Herstellung von Tubulysinen und Tubulysin-Biosynthese Proteinen, 
umfassend die Schritte: 

(a) exprimieren von wenigstens einem Polynucleotid wie in 
SEQ ID NO: 1, 18, 33 und/oder. 36 definiert und/oder • 
wenigstens einem Fragment davon und/oder wenigstens 
einem Polypeptid wie in SEQ ID NO: 2 bis 17, 19 bis 32, 
34, 35, 37 und/oder 38 definiert und/oder wenigstens 
einem Fragment davon, und 

(b) aufreinigen der Expressionsprodukte . 

Methoden zur Expression von Proteinen sind dem Fachmann bekannt 
und konnen der einschlagigen Literatur entnommen werden, 
beispielweise aus Methods In Enzymology, Vols. 154 and 155 (Wu 
et al. eds.) oder Recombinant DNA Methodology (R. Wu ed., 
Academic Press). Fur das Aufreinigen von Expressionsprodukten 
sind dem Fachmann eine Vielzahl von Methoden bekannt. Neben 
chromatographischen Methoden wie beispielsweise 
Affinitatschromatographie oder HPLC kdnnen auch immunologische 
Verfahren wie beispielsweise immobilisierte AhtikSrper gegen ein 
Epitop auf dem Expressionsprodukt, z.B. einem His-tag, zum 
Aufreinigen der Produkte verwendet werden. 

In einer bevorzugten Ausfiihrungsform erf olgt die Expression in 
prokaryotischen oder eukaryotischen Zellen und/oder durch in 
vitro Expression. Die Expression von Polypeptiden in 
prokaryotischen oder eukaryotischen Zellen ist ein haufig 
angewandtes Verfahren und wird im Allgemeinen mittels eines 
Expressionsvektors, wie oben beschrieben, erreicht. Fur die in 
vitro Expression sind ebenfalls bereits Vektoren beschrieben. 
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Diese und die notwendigen Faktoren sind kommerziell in Form von 
Kits erhaltlich, beispielsweise von BioRad, Stratagene, 
Invitrogen und Clontech. 

Desweiteren stellt die Erfindung ein Verfahren zum Auffinden von 
Genen, die an der Biosynthese von Tubulysinen beteiiigt sind, 
bereit. Das Verfahren umfasst die folgenden Schritte: 

(a) hybridisieren von wenigstens einem Polynucleotid wie in 
SEQ ID NO: 1, 18, 33 und/oder 36 definiert und/oder 
wenigstens einem Fragment davon mit DNA, RNA, und/oder 
cDNA einer Spezies, die nicht mit Angdococcus 
discifoxmls identisch ist, und 

(b) isolieren und charakterisieren der hybridisierten DNA, 
RNA, und/oder cDNA. 

Die Hybridisierung kann unter unterschiedlich stringenten 
Bedingungen durchgefuhrt werden. 

Die Stringenz der Hybridisierung, wie hierin verwendet, betrifft 
Bedingungen, unter denen Polynucleotid-Doppelstrange stabil 
sind. Wie dem Fachmann bekannt ist, ist die Stabilitat eines 
Doppelstranges eine Fuhktion der Natriumionenkonzentration und 
der Temperatur (siehe beispielsweise Sambrook et al., Molecular 
Cloning: A Laboratory Manual 2 nd Ed. (Cold Spring Harbor 
Laboratory, (1989)). Die Stringenzniveaus, die zur 
Hybridisierung verwendet werden, konnen vom Fachmann leicht 
abgewandelt werden. 

Der Begriff „schwach stringente Hybridisierung- bezeichnet 
Bedingungen, die einer Hybridisierung in 10% Formamid, 5 x 
Denharts Losung, 6 x SSPE, 0,2 % SDS bei 42°C, gefolgt von 
Waschen in 1 x SSPE, 0,2 % SDS bei 50°C Equivalent sind. 
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Denhart>s Losung und SSPE sind dem Fachmann genauso wie andere 
geeignete Hybridisierungspuf f er wohl bekannt. 

Eine ;/ moderat stringente Hybridisierung" bedeutet Bedingungen, 
die es der DNA erlauben, an eine komplementare NucleinsSure zu 
binden, die ungefahr 60 % Identitat, vorzugsweise ungefahr 75 % 
Identitat, besonders bevorzugt ungefahr 85 % Identitat zu dieser 
DNA aufweist; wobei eine Identitat von mehr als ungefahr 90 % zu 
dieser DNA besonders bevorzugt wird. Moderat stringente 
Bedingungen sind vorzugsweise Bedihgungen, die eine 
Hybridisierung in 50 % Formamid, 5 x Denharts Losung, 5 x SSPE, 
0,2 % SDS bei 42°C gefolgt von Waschen in 0,2 x SSPE, 0,2 % SDS 
bei 65 °C Equivalent sind. 

Hochstringente Hybridisierung bedeutet Bedingungen, die die 
Hybridisierung nur von solchen Nucleinsciuresequenzen 
ermoglichen, die in 0,018 M NaCl bei 65 °C stabile Doppelstrange 
bilden (d.h., wenn ein Doppelstrang in 0,018 M NaCl bei 65°C 
nicht stabil 1st, 1st er unter den hier 

beschriebenen/def inierten hochstringenten Bedingungen nicht 
stabil) . 

Weiterhin konnen NucleinsSure-Hybridisierungstechniken verwendet 
werden, um eine Nucleinsaure zu identif izieren und zu gewinnen, 
die von der yorliegenden Erfindung umfasst ist, Kurz gesagt kann 
jede Nucleinsaure mit einer gewissen Homologie zu einer in 
dieser Erfindung offenbarten Sequenz oder einem Fragment davon, 
als Sonde zur Identif izierung einer ahnlichen Nucleinsaure durch 
Hybridisierung unter moderat stringenten bis hochstringenten 
Bedingungen verwendet werden. Solche ahnlichen Nucleinsauren 
konnen dann isoliert, sequenziert und analysiert werden, um zu 
bestimmen, ob sie von der vorliegenden Erfindung umfasst werden. 
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Die vorliegende Erfindung stellt auBerdera einen Kit zur 
Herstellung von Tubulysinen, enthaltend: 

(a) wenigstens ein Polynucleotid, enthaltend eine Sequenz 
wie in SEQ ID NO: 1, 18, 33 oder 36 definiert oder ein 
Fragment davon und/oder wenigstens einen Vektor der ein 
solches Polynucleotid enthalt 

oder 

(b) geeignete Medien und Puffer zur Vermehrung von Zellen, 
die eine Expression des Polynucleotids und/oder Vektors 
erlauben, und 

(c) geeignete Mittel zum Aufreinigen des /der 
Expressionsprodukte (s) 

bereit. 

Auf Grund ihrer Wirkung auf das Tubulin-Skelett und ihrer 
Cytotoxizitat, insbesondere bei Pilzen, eignen. sich Tubuline 
auch als Desinf ektionsmittel, das eine Kontamination mit 
Tubulin-enthaltenden Zellen abbauen bzw. verhindern kann. 
Die Erfindung betrifft deshalb auch die Verwendung einer 
Zusammensetzung enthaltend wenigstens ein Polypeptid wie in SEQ 
ID NO: 2 bis 17, 19 bis 32, 34, 35, 37 und/oder 38 definiert 
und/oder wenigstens ein biologisch aktives Fragment oder Derivat 
davon als Desinf ektionsmittel . Neben dem oben definierten 
Polypeptid konnen im Desinf ektionsmittel auch andere 
desinfizierend wirkende Stoffe enthalten sein, solange sie die 
Wirkung des erf indungsgemaGen Polypeptids nicht inhibieren. 
Aufterdem kann das Desinf ektionsmittel weitere Hilfsstoffe wie 
beispielsweise Puffer, Wasser, Farbstoffe, Duftstoffe, 
Stabilisatoren, Tragerstoffe usw. enthalten. 

In einer bevorzugten Ausf uhrungsform ist die Zusammensetzung 
fliissig oder pulverf brmig . 
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Entsprechend betrifft die Erfindung auch Desinf ektionsmittel wie 
oben definiert. 

Soweit keine anderen Definitionen angegeben sind, weisen alle 
technischen und wissenschaf tlichen Begriffe, die hierin 
verwendet werden, dieselbe Bedeutung auf, wie sie Qblicherweise 
vom Fachmann auf dem Gebiet, an den sich diese Erfindung wendet, 
verstanden werden. Alle Ver6f f entlichungen, Patentanmeldungen, 
Patente und anderen hierin erwahnten Referenzen sind durch 
Bezugnahme in ihrer Gesamtheit mit auf genommen . Im Falle eines 
Konfliktes wird jedoch die vorliegende Beschreibung 
einschlie/ilich der Definitionen entscheiden. Zusatzlich sind die 
Materialien, Methoden und Beispiele lediglich veranschaulichend 
und sollen nicht als einschrankend aufgefasst werden. 
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1. Identif izierung des Tubulysin-Biosyntheseclusters in 
Axxglococans disci formis An d48 durch mariner Transposon- 
Mutagenese mittels pMycoMar 

s . - 

Die Identif izierung des Tubulysin-Biosyntheseclusters wurde 
durch die Erstellung einer Transposon-Mutantenbank aus 
Angiococcus disciformis An d48 mittels pMycoMar durchgef uhrt . 
Rubin & Mekalanos (Proc. Natl. Acad, Sci'. USA, 96 (1999) , 1645 - 
1650) ent.wickelten aus dem mariner Element Himarl das Plasmid 
pMycoMar, welches ein einf aches Transpbsitonssystem darstellt, 
das effizient Bakterien in vivo infizleren und Insertions- 
Mutanten generieren kann. Dieses Plasmid enthalt das Mini- 
Transposon magellanA , bei dem das Tn5~ Kanamycin-Resistenzgen und 
der oriR6K von den inverted repeats des Hijnarl flankiert sind. 
Zusatzlich ist die Hiinarl Transposase unter der 
transkriptionalen Kontrolle des T6 Promoters in das 
mycobakterielle Temperatur- sensitive Replicon pPR23 kloniert 
worden. Das pMycoMar codiert ebenfalls ein Gentamycin- 
Resistenzgen. 

Das Hijnarl zeichnet sich bei der Transposition durch eine TA 
Dinucleotid-Erkennungssequenz aus. Daher kann es zufallig in ein 
Wirts-Genom integrieren- und statistisch gesehen alle aktiven 
Gene durch eine Insertions-Mutation ausschalten. Aufgrund dieser 
Tatsache sollte eine Mutantenbank aus An d48 generiert und das 
Tubulysin-Biosynthesecluster durch eine Knockout-Mutante 
identif iziert werden . 

Alternativ kann man auch von Archangium gephyra DSM 11092 
ausgehen und nach einem Protokoll von Biozym Diagnostic 
(Oldendorf, DE; Katalog TSM99K2; pEZ : : TN<KAN-2> Tnp Transposome- 
Kit) arbeiten. 
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1 . 1 Generierung der Mutantenbank 

FQr eine Elektrotransf ormation von A . disciformis An d48 wurden 
zwei verschiedene Protokolle verwendet. Diese Protokolle , wurden 
fflr die Myxobakterien Stigmatella aurantiaca (Stamm & Plaga, Arch. 
Mircobiol., 172 (1995), 483 - 494) und Myxococcus xan thus (Kashefi- 
& Hartzell, Mol . Microbiology, 15 (1995) 483 - 494) etabliert . Die 
beiden Methoden zeigten in der Transf ormationsef f izienz des 
A.disciformis An d48 keinen Unterschied, so dass die 
Elektrotransf ormation zur Erstellung der Transposonbank nach dem 
Protokoll fur Stigmatella aurantiaca durchgef iihrt wurde. Im 
folgenden sind die beiden Protokolle aufgefUhrt. 

1.1.1. Elektrotransf ormation von Angxococcus disci foxmis An d48 
nach Stigmatella aurantiaca-Protokoll 

Eine in 50 ml Tryptonmedium (10 g Trypton; 2 g MgS04 2; 0,1 % 
Vitamin B12 [10 ng/ml] ; 0,2 % Glucose auf 1 1 Medium;' p H7/ 2) 
gewachsene A. disciformis Kultur wird bis 2 * 10 8 Zellen / ml bei 
30 °C kultiviert. Ausgehend von einer Generationszeit von 6 
Stunden, wurde diese Kultur am Vortag so angeimpft, dass 
rechnerisch diese Zelldichte erreicht wird. Die Kultur wird bei 
20°C abzentrifugiert (20min; 4 000rpm) und die Zellen im gleichen 
Volumen Waschpuffer (5 mM HEPES/NaOH, 0,5 mM CaCl 2; . pH '1,2) 
resuspendiert. Nach erneuter Zentrif ugation wird in 25 ml Puffer 
resuspendiert und erneut abzentrifugiert. Vox diesem 
Zentrifugationsschritt wird die absolute Zellzahl innerhalb der 25 
ml bestimmt, so dass rechnerisch 1 * i 0 9 Zellen/ 40 pi 
resuspendiert werden. 
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Elektroporat ionsbedinqunqen : 

1-3 pg DNA und 40 pi Zellsuspension werden gemischt und in eine 
auf Eis gekuhlte Elektroporat ionskuvette (0,1 cm) gegeben. Die 
Elektroporation wird bei 200 Q, 25 mF und 0,85 kV / cm. 
durchgefuhrt. 

Direkt nach der Elektroporation wird 1 ml Tryptonmedium zugegeben. 
Nach Transfer in 50 ml Tryptonmedium werden die Zellen fur eine 
phanotypische Expression 6 h bei.30°C geschuttelt. Danach wird die 
Kultur abzentrifugiert (20 min, 4000 rpm, 20°C) und in 1 ml 
Trypton resuspendiert . Ausgehend von einer 100 %-igen 
Cberlebensrate der Zellen wird eine Verdunnungsreihe erstellt und 
1*10 8 - 1*10 4 Zellen werden mit 3 ml Trypton-Sof tagar auf 
Kanamycin haltigen (50 pg / ml) Tryptonplatten plattiert. Diese 
Platten werden bei 30 °C inkubiert und nach 5-8 Tagen sind die 
ersten Klone zu sehen. 

1.1.2. Elektrotransformation von Angiococcxis dlsclfoxmis An d48 
nach Mjocococcus xanthus-Protokoll 

Die Wachstumsbedingungen der Vor- und Hauptkultur sowie 
Zentrifugationen und das abschliefiende Einengen der Zellzahl 
wurden genauso durchgefuhrt wie unter 1.1. i. angegeben ist. Dies 
ist abweichend vom Standardprotokoll fur Myxococcus xanthus 
optimiert worden . 

Elektroporationsbedingunqen : 

1-3 pg DNA und 4 0 pi Zellsuspension werden gemischt und in eine 
auf Eis gekuhlte Elektroporationskuvette (0,1 cm) gegeben. Die 
Elektroporation wird bei 400 Q, 25 pF und 0, 65kV / cm 
durchgef tihrt . 
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Direkt nach der Elektroporation wird 1 ml Tryptonmedium zugegeben 
und in exnem 1,5 ml Eppendorf -Reagenzgef aft fur 6 h bei 30°C 
geschattelt. Ausgehend von einer 100%-igen . Oberlebensrate der 
Zellen wird eine ... VerdQnnungsreihe erstellt und 1*10 8 - l*i0 4 
Zellen mit 3 ml Trypton-Sof tagar auf Kanamycin haltigen (50 ug / 
ml) Tryptonplatten plattiert. Diese Flatten werden bed 30»C 
inkubiert und nach 5 - 8 Tagen sind die ersten Klone / Mutanten zu 
sehen, die mittels Impfose. gepickt warden. 

1.2 Kultivierung der Transposonmutanten 

Die Hutanten wurden in 96'er Mikrotlter-Platten in 200 ul M7- 
Medium (5 g Probion; l g C aCl 2 ; l g MgS0 4 4 ; Ig, Hefeextrakt; 5 
g Starke; 10 g HEPES; 0,1 %. Vitamin B12 [10 ng / ml] auf 1 1 
Medium; P H7,4) bei 32 °C inkubiert und. nach 10 Tagen eine Kopie 
der gesamten Bank erstellt. Dafur wurden 50 ul Kultur jeder 
Mutante in neue Mikrotiter-Platten mit 100 ul M 7-Medium 
transferiert. Nach weiteren sieben Tagen Inkubation wurde eine 
Kopie bei -80»C als Dauerkulturen eingefroren. Die verbleibende 
Kopie der Bank wurde extrahiert, der Extrakt mittels 
Toxizitatstest auf generierte Tubulysin Knockout-Mutanten 
untersucht. 

Bei der Identif izierung von Mutanten, die in dieser Analytik 
Veranderungen ZU m Wildtyp zeigten (keine Zellkern- 
fragmentierung) , wurden diese aus der Dauerkultur rekultiviert 
Zur Kontrolle der erzielten Ergebnisse sollten 50 ml M7-Mediuxn 
GroBkulturen der entsprechenden Mutanten erneut getestet werden 
Bex eventuellen Tubulysin Knockout-Mutanten wurden die Extrakte 
zunachst uber einen HPLC-Lauf fraktioniert und anschlieliend die 
Fraktxonen mittels Toxizitatstest auf Tubulysin untersucht 
Durch die vorhergehende Fraktionierung wird eine Maskierung der 
Tubulysin-Wirkung durch Myxothiazol vermieden. Da die beiden 
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Sekundarmetabblite verschiedene Retent ionszeiten bei der Elution 
von einer C-14 Saule besitzen, liegen beide im folgenden 
Toxizitatstest in unterschiedlichen Fraktionen vor. 

1.3 Toxizitatstest 

Die Mini-Kulturen aus den 96 'Mikrotiterplatten wurden nach 
Kultivierung durch Stickstof f-Begasung auf einem Heizblock bei 
37 °C eingetrocknet . Danach wurden die Zellpellets uber 2 h in 
lOOpl Methanol resuspendiert und jeweils 10 pi fur den folgenden 
Toxizitatstest eingesetzt, urn eine Tubulysin-Produktion der 
jeweiligen Mutante detektieren zu konnen. 

Fur diesen Test werden L92 9 Zellen in DMEM-Medium (Invitrogen, 
Groningen) bei 37°C kultiviert und danach mittels Zellschaber 
vorsichtig' geerntet. Diese Zellsuspension wird anschlieBend 1 : 
10 mit DMEM verdunnt und 120 \il pro Offnung einer 
96 'Mikrotiterplatte verteilt. Diese werden anschlieftend mit den 
10 pi Zellextrakt der einzelnen Transposon-Mutanten versetzt uhd 
fur fiinf Tage bei 37 °C inkubiert. Nach dieser Inkubationszeit 
werden die L929 Zellen mikroskopisch auf Zellkernf rakmentierung 
untersucht, was ein Zeichen fur Tubulysineinwirkung ist. Bei 
Zellen, die keine Zellkernf ragmentierung .zeigten, wurden die 
entsprechenden Mutanten als mutmafiliche Tubulysin Knockout— 
Mutanten identif iziert * Die Extrakte dieser Mutanten wurden in 
50 ml . M7 -Medium ( + 1ml Absorber-Harz XAD-16 von Rohm & Haas) 
angezogen und die Zellkerne der L929-Zellen nach durchgef uhrtem 
Toxizitatstest zusatzlich durch eine Anfarbung des Chromosoms 
mittels DAPI-Farbung auf eine Zellkernf ragmentierung bzw. 
Tubulysin-Produktion untersucht. 
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1 . 4 Bestimmung des Integrationsgenortes der Tubulysin Knockout- 
Mutanten in der An d48 mariner vermittelten Mutantenbank 
mittels Transposon-recovery 

In der generierten Mutantenbank konnten mittels Toxizitatstest 
fiinf Mutanten identif iziert werden (MutT176, 524, 781, 794 und 
929), die kein Tubulysin produzierten. Dieses Ergebnis konnte 
nach Rekultivierung der Mutanten aus der Dauerkultur. und 
erneuter Analyse bestatigt werden. Um Inf ormationen zu erhalten, 
in welchen Bereich des Genoms das Himarl Element transponiert 
ist, wurde. ein Transposon-recovery durchgef iihrt . Bei ■■ dieser 
Methodik wird die chromosomale DNA der jeweiligen Mutante mit 
verschiedenen Restriktionsenzymen geschnitten, die nicht 
innerhalb der bekannten magellan4 Sequenz schneiden. Die 
restringierte DNA wird ligiert, nach Transformation in 
DH5aApir-Zellen wird auf Kanamycin haltigen LB-Platten bei '37°C 
inkubiert. Auf diesen Platten konnen nur solche E . coll Zellen 
wachsen, die ein Plasmid mit dem magellan4 und somit dem Tn5 
Kanamycin-Resistenzgen enthalten. Solch ein Plasmid enthalt an 
den Enden des Transposons chromosomale DNA aus An d4 8. Diese 
Plasmide konnen in den E.coli Zellen DH5a/A.pir replizieren, da 
innerhalb der Transposon • Sequenz der oriR6K sitzt. Das 
Transposon wurde so , aus dem jeweiligen Genom isoliert und mit 
den Primern K388 und K389 ansequenziert . Die erhaltenen 
Sequenzen wurden dann gegen die Genbank auf Homlogien zu 
bekannten Genen hin untersucht und zeigten dabei hohe 
Ahnlichkeiten zu nicht ribosomalen Peptidsynthetasen (NRPS) aus 
bekannten Sekundarmetabolit-Biosynthesegenclustern wie denen des 
Myxothiazols, Nostopeptolids und Saframycins. Diese Analysen 
waren eindeutige Hinweise dafur, dass es sich dabei um 
Sequenzf ragmente aus dem gesuchten Tubulysin-Gencluster handet . 
Durch Restriktions- und Southernanalysen wurde die Grblie der 
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einzelnen Transposon-Plasmide und ihre relativen 

Integrationsorte zueinander (innerhalb des Genclusters) 
bestimmt. 

1.4.1.. Transposon-recovery 

Isolieren chromosomaler DNA nach Standardprotokollen aus 50 ml 
Tryptonmedium-Kultur jeder A. disciformis An d4 8 Mutante. Von 
dies.er DNA werden 5 pg fur die folgende Ausklonierung des 
Transposons verwendet, indem zunachst eine Restriktion 
durchgefuhrt wird. Dabei wurden die Enzyme NotI und BamRI 
verwendet, die keine Restriktionsstelle innerhalb des magellanA 
haben und statistisch relativ haufig in GC-reicher DNfi 
schneiden sollten. 

Verdau der qenomischen DNA mit NotI bzw. BamHI: 

5 \ig DNA 
+ 3 pi 10 x NEB Puffer 
+ 3 pi 100 x BSA 

+ 10 U Restriktionsenzym (BamHI bzw. NotI) 
+ x pi dest. H 2 Q 

30 pi Ansatz fur 3 h bei 37 °C inkubieren => wiederum 10 U 
Enzym zu den Restriktionsansatzen zugeben und weitere 2 h 
bei 37 °C inkubieren. 

Fallen der restringierten DNA und folgende Ligation 

Der gesamte Restriktionsansat z von 30 pi wird mit 1 Vol. 
Chloroform/Phenol versetzt und fur 10 min. zentrif ugiert 
(13.200 rpm; 20°C) . Der Oberstand wird in ein neues 
Reaktionsgefafi uberfiihrt und mit 1/10 Vol. 3 M NaOAc und 2,5 
Vol. 100% EtOH versetzt. Zum fallen der DNA wird das 
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Reaktionsgefali fur 1 h bei -20°C inkubiert und anschlieflend far 
30 min. zentrifugiert (13.200 rpm; 4°C) . Der Oberstand wird 
verworfen und das Pellet dreimal mit 70% EtOH gewaschen, wobei 
man jeweils 5 min. zentrif ugiert (13.200 rpm; 20°C) . Nach. dem 
Verwerfen des Oberstandes wird das Pellet bei 37°C getrocknet 
und in 15 pi H 2 0 resuspendiert . Fur die anschlieliende Ligation 
werden die gesamten 15 pi der gefallten DNA verwendet. 

Liqatio nsansatz : 15 p i DNA 

+ 4 ul 5 x Ligasepuffer (NEB) 

+ 1 ul NEB Liqase 

20 ul Ansatz iiber Nacht bei 16°C inkubiert 
=> wiederum 1 pi Ligase zu den Ligationsahsatzen und ON 

bei 16°C inkubieren. 

Elektrotransformation der Liqatio n sansatze in den E. coll ■ 
DH5a-A,pir 



1-3 pi der Liqationsansatze und 50 pi DH5<x-*pir Zellen werden 
gemischt und in eine auf Eis gekuhlte Elektroporationsktivette 
(0,1 cm) gegeben. Die Elektroporation wird bei 200 Q, 25 mF und 
l,25kV / cm durchgefOhrt. Die Zellen werden danach in 1 ml LB- 
Medium (10 g Trypton; 10 g NaCl; 5 g Hefeextrakt auf 1 1 Medium) 
aufgenommen und far 1 h bei 37°C inkubiert. Danach werden sie 
auf Kanamycin-haltigen (50 pg / ml) LB-Platten ausplattiert . 
Nach einem Tag Inkubation bei 37 »C konnen die Klone gepickt 
werden. Dabei k5nnen nur Zellen anwachsen, die ein Transposon- 
Plasmid beinhalten und damit eine Tn5-Kan R vermittelte 
Resistenz besitzen. 
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1.5 Sequenzauswertung des Tubulysin Biosyn these -Genclusters aus 
pM\atT794/NotI 

Das Transposon-Plasmid pMutT7 94/NotI enthalt 52985 bp 
chromosomale DNA aus Angiococcus disciformis An d4 8. Zusammen 
mit dem Himarl Minitransposon magellan4 (2199 bp) , das bei 
Basenpaar 37317 bp in das Plasmid integriert ist, wurden 55184 
bp sequenziert. Insgesamt 217 60 bp stammen aus codierenden Genen 
des Tubulysin-Genclusters und sowie 31219 bp weitere codierende 
Gene. Bei diesen ORF's handelt es sich zum Teil urn 
Regulatorgene, die die Expression des TubUlysins beeinflussen 
kSnnen. Sequenzvergleiche mit den Transposon-Plasmiden der 
anderen Tubulysin Knockout-Mutanten zeigten, dass das ma gel la n4 
bei den Mutanten MutT781 (36975bp) und MutT929 (36197 bp) 
innerhalb von 1658 bp zu MutT794 in das Biosynthese-Gencluster 
transponiert sind. 

Auf der Sequenz ist der Start des Tubulysin-Genclusters mit drei 
NRPS-Modulen ( tubA-C ), einem Cyclodeaminase codierendem Gen 

(tubZ) und einem PKS-Modul (tubD) enthalten. Desweiteren liegen 
innerhalb des Genclusters ein Anionentransporter codierendes Gen 

(ORF1), das zum Austransport des Tubulysins aus der Zelle dient 
und ein weiterer ORF (ORF2) .. Die grundsatzliche Anordnung der 
Gene, sowie der einzelnen Domanen mit einer N-Methyltransf erase 
innerhalb der Adenylierungsdomanen (A) von tubB und tube, 
entsprechen dem ' typischen Auf bau des Genclusters und der damit 
verbundenen Tubulysin-Biosynthese . Die Methyltransf erase- Domanen 

(NMT) sind aber im Gegensatz zu bekannten Genclustern-Strukturen 
nicht zwischen der Adenylierungs- und Thiolierungs-Domane (PCP) 
lokalisiert, sondern zwischen A8 und A9 innerhalb der 
Adenylierungs-Domane (A) (hoch konservierte Regionen innerhalb 
der Adenylierungs-Ddmanen von NRPS; Konz & Marahiel, Chem. 
Biology, 6 (1999) R39 - R48). TubA, codiert eine unvollstandige 
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Kondensationsdomane, die fur die Biosynthese theoretisch nicht 
benbtigt wird. Die am Ende der bekannten Sequenz liegende 
Polyketidsynthase (PKS) enthalt eine Ketoacylsynthase- (KS), 
Acyltransf erase- (AT) und Ketoreduktase- (KR) Domane. 

Die restliche Sequenz des Tubulysin-Biosynthesegenclusters wurde 
aus einer Cosmidbank von An d4 8 (hinterlegt bei der DSMZ) unter 
Standardbedingungen identif iziert . Das auf der ersten Halfte der 
Sequenz endende PKS-Modul (tui>D) wird fortgesetzt von den schon 
erwahnten KS, AT und KR-Domanenund beeinhaltet weiterhin eine 
Enoylreduktase (ER) und ein Acyl Carrier Protein (ACP) . In der 
folgenden Sequenz von tubD wird eine NRPS codiert, die eine 
Heterozyklisierungs- - (HC) , Adenylierungs- (A) und Peptidyl 
Carrier Protein- (PCP) Domane tragt. Des weiteren folgen die 
Gene tubE und tubF. Das Gen tubE codiert eine NRPS mit den 
Domanen C, A und PCP. Auf tubF wird eine PKS mit der folgenden' 
Domanen-Anordnung codiert: Ketoacylsynthase (KS) , Acyltrans- 
ferase (AT), Ketoreduktase (KR) , C-Methyltransf erase ( CMT ) , 
Dehydratase (DH), Enoylreduktase (ER) , Acyl Carrier Protein 
(ACP) und schlieMich eine Thioesterase, die fur die Abspaltung 
des fertigen Tubulysins in Form einer freien Saure vom 
Multienzymkomplex sorgt. Der Insertionsort des Transposons 
magellan4 liegt bei der MutT176 bei Basenpaar 54579 innerhalb 
des Biosynthesegenclusters. Der Insertionsort der Mutante 
MutT524 liegt nicht auf der uns bekannten Gencluster-Sequenz . 
Wir postulieren daher, dass der Insertionsort innerhalb eihes 
fur eine Acyltransf erase codierenden Genes liegt, das downstream 
vom Tubulysin-Biosynthesegencluster liegt und eine 
posttranslationale Funktion zur Modifikation des Tubulysins hat. 
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— Identifizierung der Anschluss sequenz des Tubulysxn- 

Biosynthese-Gencl usters aus Ancrlococcus dlsclfojxnis An d48 

2.1 Identif izierung und Charakterisierung von Cosmiden, die eine 
uberlappenede Sequenz downstream zum Tubulysin-Biosynthese- 
Gencluster tragen 

Im vorhergehenden Beispiel wurde beschrieben wie die erste 
Halfte des Tubulysin-Biosynthese-Genclusters zusammen mit 
weiteren an der Biosynthese beteiligten Genen mittels mariner 
basierender Transposon-Mutagenese und anschliefiendem Transposon- 
recovery identif iziert und annotiert wurde. Da innerhalb dieser 
Sequenz sowohl codierende Gene far Monooxigenasen als auch 
Acyltransferasen fehlen, sollte noch weitere Sequenz downstream, 
von dieser identif iziert und charakterisiert werden. Innerhalb 
dieser Sequenz sollten oben angegebene Gene codiert vorliegen, 
da sie fur die Biosynthese des Tubulysins erforderlich sind. Das 
Biosynthese-Gencluster sollte auf diesem Weg vollstandig 
identif iziert werden. 

Hierfur wurde eine Cosmidbank aus A. disciformis\n d48 mittels 
Gigapack II XL packaging-kit (Fa. Stratagene) in E.coli SURE 
erstellt. Innerhalb. dieser Bank sollten Cosmide identif iziert 
werden, die einen langeren Oberlapp mit dem Tubulysin- 
Biosynthese-Gencluster downstream von tubF besitzen. Daftir 
wurden aus der bekannten Sequenz des Tubulysin-Genclusters zwei 
Primerpaare abgeleitet und die PCR-Amplif ikate als Sonden fur 
die folgende Hybridisierung der Cosmidbank eingesetzt. Das erste 
Primerpaar ASTlslA-lB liefert ein 889 bp groGes DNA-Fragment und 
liegt 1 kb vor der Wotl-Restriktionsschnittstelle in tubD. Das 
zweite Primerpaar ASTls2A-2B generiert ein 700 bp Fragment, das 
11 kb upstream im bekannten Cluster-Ende entfernt in tubC liegt. 
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Die PCR wurde bei 54 °C Annealing-Temperatur durchgef uhrt . Durch 
diese Hybridisierung konnten verschiedene Cosmide identif iziert 
werden. Mittels PCR- und Restriktionsanalytik wurden sie auf die 
Grofte ihrer Oberlappung - mit der bekannten Cliister-Sequenz 
untersucht . HierfUr wurden wiederurri ; die Primerp'archen ASTlslA/B 
und ASTls2A/B bei einer Annealing-Temperatur von 58 °C 

eingesetzt. Bei der Restriktion wurden verschiedene Enzyme in 
Einzel- und Doppelrestriktionen eingesetzt. 

Da die Cosmide F7 und F13 nach den Restriktionsanalysen einen 
ahnlich groBen Oberlapp mit dem ersten Teil des Clusters 
zeigten, tragt eines dieser Cosmide die n6tigen genetischen 
Informationen, um die unmittelbar clustergebundenen Gene 
identif izieren zu konnen. 

2.1.1 Southern-Analytik der Cosmide F7 und F13 

Fur die Identif izierung des richtigen Cosmids wurden zunachst 
Restriktionsenzyme ausgewahlt, die moglichst selten und am Ende 
der bekannten Genclustersequenz schneiden. Die ausgewahlten 
Enzyme waren Ndel und NslI, die an den Positionen 39306 bp bzw. 
394 30 bp schneiden. Des weiteren schneiden beidfe Enzyme nur ein 
weiteres Mai in der bekannten Sequenz. Mit einer generierten 
Sonde (Primerpaar Tls up / d own) / die hinter diesen Schnitten direkt 
am Ende der bekannten Cluster-Sequenz bindet, sollte nuri die 
Cosmid-Genbank A/ gescreent^ werden. Die Cosmide wurden dafur in 
verschiedenen Doppelrestriktionsansatzen hydrolisiert und auf 
einem Agarosegel (0,8 %) aufgetrennt. Fur die Doppelrestriktion 
wurden neben Ndel und Nsil die Enzyme BamHI, EcoRI, und NotI 
ausgewahlt. Durch die Kombinationen mit EcoRI und Notl sollte 
erreicht werden, dass mittels der Hybridisierung ein Fragment 
identif iziert wird, welches bis an das Ende des jeweiligen 
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Cosmid-lnserts reicht.. Falls dieses Fragment fiir eine 
nachfolgende Klonierung zu groli. sein sollte, wurde ebenfalls 
BamHl verwendet, urn eventuell kurzere Fragmente zu erhalten. Die 
Hybridisierung wurde bei 42 °C durchgef uhrt, und es wurde Unter 
hochst stringenten Bedingungen gewaschen (68°C) . 

Das Ergebnis dieser Analytik war, class in dem " ffcoRI ' / Ndel- 
Restriktionsansatz des Cosmids F7 ein 12 kb Fragment detektiert 
wurde. Dieses Fragment enthalt die restliche Sequenz des 
Tubulysin-Genclusters und reicht bis zum Ende der Insert-Sequenz 
des Cosmids. Diese Schlussf olgerung wurde aus den 
Restriktionsanalysen und der charakterisierten Oberlappung mit 
der Tubulysin-Genclustersequenz geschlossen. Das detektierte 
Notl / Ndel - Fragment ergab eine Grofie von 4,2 kb. Daher muss 
innerhalb der 12 kb Insertsequenz von F7 - zwischen Anfang (Ndel 
- Restriktionsstelle) und Vektor (scos) - mindestens eine 
weitere Wotl-Schnittstelle liegen. Somit kann die 
Anschlusssequenz in kleineren Fragmenten (als Ndel / Notl - und 
Notl / Atotl-Fragmente) , kloniert und sequenziert werden. Der 
BamHl I Nsil Doppelrestriktionsansatz lief erte . insgesamt fUnf 
Fragmente. 



2.1.2. Klonierung der restlichen Tubulysin-Genclustersequenz aus 
Cosmid F7 



Das Cosmid F7 wurde in einem Doppelrestriktionsansatz mit den 
Restriktionsenddnucleasen Nsil und EcoRI geschnitten (2 h; 
37 °C). Nach einer Auftrennung des Restriktionsansatzes mittels 
0,8 %igem Agarosegel, wurde die entsprechende Bande aus dem Gel 
ausgeschnitten und mit dem NucleoSpin kit (Fa. Macherei-Nagel) 
extrahiert. Das isolierte Fragment wurde mit Notl 



WO 2004/022586 




CTYEP2003/009780 



38 



nachgeschnitten, urn zu uberprlifen, ob die erzielten 
Hybridisierungsergebnisse bestatigt werden. Zusatzlich wurde 
uberpruft ob weitere Notl-Erkennungssequenzen innerhalb der 12 
kb Anschlusssequenz liegen, um die Anzahl der zu ' klonierenden 
Teilf ragmente. bestimmen. zu konnen.' Die Restfiktion ergab nach 
einer Auftrennung auf einem 0, 8%igem Agarosegel ein 4,2 (Nsil / 
Notl-Fragment) und 8 kb groftes Fragment (Notl / No tl- Fragment ) . 

Zum einen konnte somit das Hybridisierungsergebnis bestatigt 
werden und beide Fragmente . konnten fur eine Klonieirung 
eingesetzt werden. Zum anderen wurde bestatigt, dass es sich um 
das richtige Fragment handelt, das die Sequenz downstream des 
Clusters tragt. 

Kloniert wurden das 12,2 kb grofie Nsil / EcoRI - Fragment, sowie 
die 4,2 kb (Nsil / Notl) und 8 kb (Notl / Notl) grofien Fragmente 
in den Vektor pUC18. Der Vektor wurde fur die folgende Ligation 
mit PstI / EcoRI bzw. PstI / Notl und Notl geschnitten. Pstl und 
Nsil besitzen ein kompatibles Schnittmuster , so dass nach 
erfolgreicher Klonierung, diese Schnittstellen nicht mehr 
vorhanden sind. Mittels Jfindlll bzw. Ndel und EcoRI kann in 
einer Doppelrestriktion das 12 kb Insert wieder aus dem pUC18 - 
Derivat herausgeschnitten werden. 

Die erhaltenen Klone wurden mittels dieser Restriktionsansatze 
auf ihre Richtigkeit hin uberpruft. Einer dieser Klone (ASpUC12) 
wurde fur eine folgende in vitro Transposition mitels GPS™ - 1 
Genome Priming System (Fa. New England Biolabs Inc ) eingesetzt. 

2.1.3. In vitro Transposition mit GPS - 1™ Genome Priming 
System 
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Durch das GPS - 1 System sollte mittels einer auf Tn7 
basierenden in vitro Transposition das klonierte Nsil / NotI 
Fragment sequenziert werden. Bei diesem „kit« wird eine TnsABC 
Transposase verwendet, die das Transposon (Transprimer™) 
zufallig in die Zielsequenz inseriert. Durch spezifische 
Sequenzierprimer (PrimerN / PrimerS) , die aus den f lankierenden 
Enden des Transposons „herauslesen" , kdnnen die anliegenden 
Bereiche des DNA-Inserts sequenziert werden. Da das Transposon 
zufallig in die Zielsequenz inseriert wird, kann durch 
Sequenzieren einer bestimmten Anzahl generierter Transposon- 
Mutanten die gesamte Zielsequenz charakterisiert werden. 

Durchfiihrung der in vitro Transposition 

2 -ul 10 x GPS-Puffer 
+ 1 ul pGPS 1.1 (vermittelt Kan R ) 

+ , 0,2 ul Ziel - DNA (entsprechen 80 ng ASexp7) 
+ 14, 8 ul dH 2 0 

18 ul Ansatz 

Dieser Ansatz wird gut durchmischt und mit 1 pi TnsABC 
Transposase versetzt (wiederum durchmischen) . Der gesamten 
Reaktionsansatz wird fur 10 min. bei 37°C inkubiert, damit sich 
die Transposase vor der eigentlichen Reaktion im Reaktionsansatz 
vermischt.. Nach der Zugabe von 1 ul „start solution^ wird "der 
Reaktionsansatz :fur eine Stunde bei 37 °C inkubiert. In dieser 
Zeit kommt es zum Strangtransf er des Transposons in die Ziel- 
DNA. Danach wird die Reaktion durch Inkubation fur 10 min. bei 
75 °C abgestoppt. Von diesem Ansatz wurden 2 pi in E.coli DH10B 
transformiert und auf Kanamycin-haltigem Medium ausplattiert . 
Insgesamt sind ca. 2000 Klone nach einer Inkubation iiber Nacht 
bei 37°C gewachsen. 
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Von diesen Klonen wurden 20 daraufhin uberprtift, in welchem 
Verhaltnis das Transposon in das Insert oder den Vektor 
inseriert ist. Dafur wurden diese Klone in einem 
Doppelrestriktionsansatz mit den Endonukleasen EcoKl und Hindi II 
hydrolisiert. Die Restriktionsanalyse ergab, dass bei 75% der 
Klone das Transposon in das Insert inseriert waren; Somit wurden 
192 Klone sequenziert, wodurch eine ca. 12 fache Abdeckung der 
Sequenz erreicht wurde (bei 500 bp Lauflange je Sequenzierung) . 



2.2 Sequenzanalyse und Annotieren der 12 kb Anschlussseguenz 

Die erhaltene Restsequenz des Tubulysin-Biosynthese-Genclusters 
ist 12.219 bp lang und hat eine Oberlappung mit der vorher 
identifizierten Sequenz von 133 bp. Sequenzabschnitte, bei denen 
nur eine einfache Abdeckung vorlag, wurden durch erneute 
Sequenzierungen spezifischer Klone doppelstrangig sequenziert. 
In dieser Sequenz ist von Basenpaar 6416 - 6898 eine 
Acyltransferase (Position 76.787 - 77.545 bp in Gesamtsequenz) 
codiert. Die anderen identifizierten ORFs haben ebenfalls eine 
Funktion in der Tubulysin-Biosynthese . Die Gesamtsequenz betragt 
somit 82.8 68 bp. 



3. Identifizierung einer Tubulv s in iaberproduzierenden Mutante 
innerhalb der nar iner-Transposon Mii-tanteabank 

Um die Mutanten der Transposonbank auf weitere auffallige 
Phanotypen gegenUber dem Wildtypen zu untersuchen, wurde eine 
HPLC-Analytik durchgef iihrt . Dabei wurde uberpriift, ob die 
Insertion des Transposons in chromosomale Bereiche von 
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Biosynthese-Genclustern anderer, exprimierter Sekundarstof f e 
stattgefunden hat. Bei diesen Vergleichen gegenuber einem 
Extrakt des Wildtypen sollten dann nicht produzierende Mutanten 
der jeweiligen Metabolite identif iziert werden. Zu diesen 
Metaboliten gehoren das Myxothiazol (Gerth et al. 1980 J 
Antibiot (Tokyo) 33 (12 ): 1474-1479 und Silakowski et al. 1999 J 
Biol Chem. 274(52) :37391-9, Myxochelin (Gerth et al. 1983 J 
Antibiot (Tokyo) 36 ( 9) : 1150-6 . und Silakowski et al. 2000 Eur J 
Biochem. 267 (21) : 6476-85) und Angiolam (Kunze et al . 1985, J 
Antibiot (Tokyo) 38 (12) : 1649-54) . . 

Bei den Auswertungen der 1,200 HPLC-Laufe fielen Extrakte 
einiger Mutanten auf, bei denen eine erhdhte Myxothiazol- 
Produktion gemessen werden konnte. Zur Kontrolle der erzielten 
Ergebnisse wurden 50 ml M7 -Medium Kulturen der entsprechenden 
Mutanten erneut getestet und Zeit kinetiken zur Myxothiazol- 
Produktion tiber mehrere Tage gegentiber dem Wildtypen, erstellt. 
Die Ergebnisse dieser Untersuchungert zeigten eine deutlich 
erhShte Produktion des Myxothiazols in den verschiedenen 
Mutanten bezogen auf den An d48 Wildtypen. 

Die Bestimmung des Transposon-Insertiohsortes innerhalb der 
jeweiligen Mutante erfolgte mittels „Transposon-recovery" und 
anschliefiender Sequenzierung der f lankierenden Bereiche (siehe 
1.4). Die erhaltenen Sequenzen wurden gegen die Genbank auf 
Homlogien zu bekannten Genen hin untersucht und zeigten hohe 
Ahnlichkeiten zu regulatorischen Elementen / Genen aus 
bakteriellen Organismen. Aufgrund dieser Ergebnisse wurde die 
gesamte Mutantenbank auf Tubulysin uberproduzierende Mutanten 
hin untersucht. Dafiir wurde der bestehende Toxizitatstest (siehe 
1.3) optimiert. Durch mehrfache VerdQnnungen des jeweilig 
eingesetzten Mutanten-Extraktes im Toxizitatstest wird eine 
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Ausdunnung des Tubulysins erreicht und somit ist die 
charakteristische Wirkung auf L929 Zellen ab einer bestimmten 
Verdunnung nicht mehr detektierbar . Ahhand dieser 
Verdunnungsreihen (aus der gesamten Mutantenbank) wurden 
Mutanten identif iziert , bei deneh significant hohere 
Verdunnungen benotigt werden, um keine Wirkung mehr feststellen 
zu konnen. Dies bedeutet, dass die jeweiligen Mutante eine 
erhohte Prpduktion des Tubulysins aufweist. 

Es konnte die Mutante Mutl58 identif iziert werden, die eine 
vierfach erhShte Tubulysin D-Produktion zeigte . Dieses Ergebnis 
wurde sowohl durch die Anzucht . der Mutante in 50 ml Kultureri 
uber HPLC-MS Untersuchungen, als auch mehreren Kinetiken mit 
folgendem, optimiertem Tpxizitatstest gegeniiber dem Wildtypen 
gezeigt. M.ittels des Toxizitatstest wurde sogar eine achtfache 
Oberproduktion von Tubulysinen ermittelt. Dabei wird die 
Gesamtwirkung aller Tubulysin-Derivate detektiert und nicht nur 
die von Tubulysin D. Die Mutante 158 weist somit vollig 
uberraschend noch Oberexpression von weiteren Tubulysinen 
gegenuber dem Wildtypen von A.disciformis auf. Dies war in 
keinster Weise zu erwarten gewesen. Die Ausklonierung des 
genomischen Bereichs unmittelbar an der Insertionsstelle des 
Transposons und die Sequenzierung erfolgte wie unter 1.4 : 
beschrieben. 

Die Sequenz des betroffenen Gens zeigt hohe Ahnlichkeiten zu 
einer Proteinkinase (aus Stigmatella aurantiaca) , wobei der 
Insertionsort des Transposons die Promotorregion dieses Genes 
betrifft. Ohne auf diesen Wirkmechanismus festgelegt zu werden, 
besitzt dieses Gen eine negativ regulatorische Funktion fur die 
Tubulysin-Bildung, weshalb eine Inaktivierung des Gens zu einer 
erhohten Produktion f tlhrt . Die Gesamtsequenz beinhaltet 2. 200 
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bp, wobei die Proteinkinase von 
wird und insgesamt 1.209 bp groft 
codiert ein : Tubulysin-Bios.ynthese 



^^CT/EP2003/009780 



Basenpaar 1.228 - 20 codiert 
ist. Der upstream liegende ORF 
Protein und ist 933 bp grofi . 



Primer sequenzen : 

Sequenzierprimer fur das Himarl Mini-Transposon magellanA 
K-388: 5'-^3' 5 TGG GAA TCA TTT GAA GGT TGG 3 SEQ ID NO: 39 

K-389: 3'~>5' 5 TGT GTT TTT CTT TGT TAG ACC G 3 SEQ ID NO: 40 

Primerpaar ASTlslA/B wurde abgeleitet aus tubD und ergibt ein 

88 9 bp Fragment 

ASTlslA 5 'CAC CCG GAG CTG CCT GGA TTC 3 SEQ ID NO: 41 

ASTlslB 5 'TGC TCG GCT GGC GCT ACT CAC 3 ' SEQ ID NO: 42 



Primerpaar ASTls2A/B wurde abgeleitet aus tui>C und ergibt ein 

7 00 bp Fragment 

ASTls2A 5 'GCT CCC GGG CCA CGT GGT TGA AGA 3 ' .SEQ ID NO: 4 3 
ASTls2B 5 CCG CGG GCC GTG GGA GTG GTG TA 3 ' SEQ ID NO: 4 4 



Primerpaar Tls up / Tls d0 wn wurde abgeleitet aus tujbF und ergibt 

ein 125 bp Fragment 

Tls up 5 TGG CAG CCA GCC CGA GC 3 ' SEQ ID NO: 4 5 

Tls down 5 'CCG CGG GTG CCC TCT CAT C 3 ' SEQ ID NO: 4 6 
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28% Identitat, 39% 
Ahnlichkeit zu konserviert 
hypothetischem Protein 
PCanthomonas axonopodis] 
NP 641500 


37% Identitat, 49% 
Ahnlichkeit zu 
hypothetischem Protein 
[Rhizobium etli] 
NP 659913 


34% Identitat, 52% 
Ahnlichkeit zu 
hypothetischem Protein 
[Nostoc punetiforme] 
ZP 00109292 


31% Identitat, 44% 
Ahnlichkeit zu Pyrrolin 
Carboxylatreductase NosF 
[Nostoc sp.] 
AAF17284 


Tubulysin tiberproduzierende 
Mutante 


Tubulysin tiberproduzierende 
Mutante 


927 bp 
33.859 Da 


882 bp 
32.668 Da 

■ 


1.263 bp 
49.133 bp 


1.077 bp 
37.621 Da 


1.209 bp 
44.079 Da 


933 bp 
33.229 Da 






1.550-2.812 
(SEQIDNO: 18) 


72-1.148 
(SEQIDNO: 18) 


973-2181 
(SEQ ID NO: 36) 


44-976 

(SEQIDNO: 36) 


77.769 - 78.695 
(SEQIDNO: 1) 


79.138-80.019 
(SEQIDNO: 1) 


81.319-80.057 
(SEQ ID NO: 1) 


82797-81.721 
(SEQIDNO: 1) 


1.228-20 


CN 
CN 

1 

CN 


ORF21: 

Tubulysin Bioynthese 
Protein 

SEQIDNO: 16 


ORF22: 

Tubulysin Bioynthese 
Protein 

SEQ ID NO: 17 


ORF23: 

Tubulysin Bioynthese 
Protein 

SEQ ID NO: 20 


ORP24: 

Carboxylatreductase 
SEQIDNO: 19 


ORF25: 
Proteinkinase 
SEQ ID NO: 38 


ORF26: ( 

Tubulysin Bioynthese 
Protein 

SEQ ID NO: 37 
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Patentanspriiche 

1. ss-DNA-Molektil, ausgewahlt aus der folgenden Gruppe: 



(i) 



ss-DNA-Molektil mit einer Sequenz gemafi Figur 1; 



(ii) ss-DNA-Molektil, das mit einem ss-DNA-Molektil ge.maft (i) 

hinsichtlich seiner Nucleotid-Anzahl oder seiner 
Nucleotid-Sequenz zu jeweils 90, 91, 92, 93, 94, 95 
96, 97, 98, 99 oder 100% homolog ist, jedoch von dem 
ss-DNA-Molektil gemafi (i) hinsichtlich seiner 
Nucleotid-Anzahl und/oder seiner Nucleotid-Sequenz in 
mindestens einem Nucleotid abweicht; und 
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(iii) ss-DNA-Molekul mit einer Sequenz, die zur Sequenz 

eines ss-DNA-Molekuls gemafi (i) oder Tii) komplementar 
ist . 

2. ds-DNA-Molekul aus einem ss-DNA-MolekM gemafi Anspruch 1 
und einem dazu komplementaren Strang. 

3. ss-DNA-Molekiil, ausgewShlt . aus der folgeriden Gruppe: 

(i) ss-DNA-Molekiil mit einer Sequenz der Positionen 3-308 
bis 1 (ORF 16) der Sequenz gemSB : Figur 1; 

(ii) ss-DNA-Molekiil mit einer Sequenz der Positionen 4706 
bis 3453 (ORF 15) der Sequenz gemafi Figur 1; 

(iii) ss-DNA-Molekiil mit einer Sequenz der Positionen 5719 
bis 7164 (ORF 14) der Sequenz gemafi Figur 1; -v 

(iv) ss-DNA-Molekiil mit einer Sequenz der Positionen 9557 
bis 7317 (ORF 13) der Sequenz gemafi Figur 1; 

(v) ss-DNA-Molekiil mit einer Sequenz der Positionen 12193 
bis 10550 (ORF 12) der Sequfenz gemafi Figur 1; 

(vi) ss-DNA-Molekiil mit einer Sequenz der Positionen 12841 
bis 13881 (ORF 11) der Sequenz gemafi Figur 1; 

(vii) ss-DNA-Molekiil mit einer Sequenz der Positionen 14833 
bis 13835 (ORF 10) der Sequenz gemafi Figur 1; 



(viii) 



ss- DNA-Molekiil mit einer Sequenz der Positionen 
bis 15586 (ORF 9) der Sequenz gemafi Figur 1; 



14942 
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(ix) 



(x) 



(xi) 



(xii) 



(xiii) 



(xiv) 



(xv) 



(xvi) 



(xvii) 



(xviii) 



ss-DNA-Molektil mit einer Sequenz der Positionen 15847 
bis 16983 (ORF 8) der Sequenz gemaB ■ Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 21154 
bis 18809 (ORF 7) der Sequenz gemaB Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 22366 
bis 23532 (ORF 6) der Sequenz gemaB Figur 1; 

ss-DNA-Molekul mit einer Sequenz der Positionen 24591 
bis 26513 (ORF 5) der Sequenz gemaB Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 26597 
bis 27517 <ORF 4) der Sequenz gemaB Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 29858 
bis 30400 (ORF 3) der Sequenz gemaB Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 31220 
bis 32392 (TubA) der Sequenz gemaB Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 33056 
bis 32397 (ORF 2). der Sequenz gemaB Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 34195 
bis 33074 (TubZ) der Sequenz gemaB Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 35422 
bis 34205 (ORF 1) der Sequenz gemaB Figur 1; 



(xix) 



ss-DNA-Molektil mit einer Sequenz der Positionen 35522 
bis 40147 (TubB) der Sequenz gemaB Figur 1; 
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ss-DNA-Molekul mit einer Sequenz der Positionen 40144 
bis 48021 (TubC) der Sequenz gemafi Figur 1; 

ss-DNA-Molekul mat einer .Sequenz der Positionen 48011 
bis 58558 (TubD) der Sequenz gemaB Figur 1; 

ss-DNArMolekul mit einer Sequenz- der Positionen 58551 
bis 62096 (TubE) der Sequenz gemaB Figur 1; 

ss-DNA-Molekul mit einer Sequenz der Positionen 62103 
bis 70616 (TubF) der Sequenz gemaB Figur 1; 

ss^DNA-Molekulv das mit einem Mole ktil gemaB (i), (ii) , 
(iii), (iv), (v), (vi), (vii), (viii), (ix), (x), 
(xi), (xii), (xiii), (xiv), (xv), (xvi), (xvii), . 
(xviii), (xix), (xx), (xxi), (xxii) oder (xxiii) uhter 
stringenten Bedingungen hybridisierbar ist und 
insbesondere dieselbe Anzahl von Basen aufweist ; und 

ss-DNA-Molekul , das mit einem ss-DNA-Molekul gemafi 
(i), (ii), (iii), (iv), (V), (Vi) , (vii) , (viii) , ' : 
(ix), (x), (xi), (xii), (xiii), (xiv), (xv), (xvi), 
(xvii), (xviii), (xix), (xx), (xxi), (xxii) oder 
(xxiii) hinsichtlich seiner Nuclebtid-Anzahl oder 
seiner Nucleotid-Sequenz zu jeweils 90, 91, 92, 93, 
94, 95, 96, 97, 98, 99 oder 100% homolog ist, jedoch 
von diesem ss-DNA-Molekul hinsichtlich seiner 
Nucleotid-Anzahl und/oder seiner Nucleotid-Sequenz in 
mindestens einem Nucleotid abweicht; und 



(xx) 



(xxi) 



(xxii) 



(xxiii) 



(xxiv) 



(xxv) 
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(xxvi) ss-DNA-Molekul mit einer Sequenz, die zur Sequenz 
eines Mole kii Is gemafi (i) , (ii) , .(ill), (iv) , (v) , 
(vi), (vii), (viii), (ix), (x), (xi) ; (xii), (xiii), 
(xiv) , (xv), (xvi) , (xvii), (xviii), (xix) , (xx), 
(xxi) , (xxii) ,.■ (xxiii) , (xxiv) oder (xxv) komplementar 
ist . 

4. ds-DNA-Molekal aus einem s s — DN A-Mo 1 e ku 1 gemafi Anspruch 3 
und einem dazu komplementaren Strang. 1 

5. ss-DNA-Molekai, ausgewahlt aus der folgenden Gruppe: 

(i) ss-DNA-Molekul mit einer Sequenz der Positionen 35747 
bis 36769 ( Domane C des tubB-Gens ) der Sequenz gemafi 
Figur 1; 

(ii) ss-DNA-Molekul mit einer Sequenz der Positionen 37184 
bis 39817 (Domane A des tubB-Gens) der Sequenz gemafi 
Figur 1; 

(iii) ss-DNA-Molekul mit einer Sequenz der Positionen 38369 
bis 39730 (Domane NMT des tubB-Gens) der Sequenz gemafi 
Figur 1; 

(iv) ss-DNA-Molekul mit einer Sequenz der Positionen 39818 
bis 40069 (Domane PCP des tubB-Gens) der Sequenz gemafi 
Figur 1; 

(v) ss-DNA-Molekul mit einer Sequenz der Positionen 4 0372 
bis 41397 (Domane C des tubC-Gens) der Sequenz gemafi 
Figur 1; 
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(vi) ss-DNA-Molekul mit einer Sequenz der Positionen : 41824 
bis 43215 (Domane A des tubC-Gens) der Sequenz gemSfi 
Figur 1; 

(vii) ss-DNA-Molekul mit einer Sequenz der Positionen 43216 
bis 434 61 (Domane PCP des tubC-Gens) der Sequenz gemaB 
Figur 1; 

(viii) ss-DNA-Molekai- mit einer Sequenz der Positionen 43552 
bis 44574 (Domane C des tubC-Gens) der Sequenz gemaB 
Figur 1; 

(ix) ss-DNA-MolekOl mit einer Sequenz der .Positionen 44980 
bis 47631 (Domane A des tubC-Gens) der Sequenz gemaB 
Figur 1; 

(x) ss-DNA-Molekai mit einer Sequenz der Positionen 46153 
bis 47547 (Domane NMT des tubC-Gens) der Sequenz gemaB 
Figur 1; 

(xi) ss-DNA-Molekul mit einer Sequenz der Positionen 47632 
bis 4 7868 (Domane PCP des tubC-Gens)' der Sequenz gemaB 
Figur 1 ; 

(xii) ss-DNA-Molekul mit einer Sequenz der Positionen 48011 
bis 4 9321 (Domane KS des tubD-Gens) der Sequenz gemaB 
Figur 1 ; 

(xiii) ss-DNA-Molektil mit einer Sequenz der Positionen 49622 
bis 50584 (Domane AT des tubD-Gens) der Sequenz gemaB 
Figur 1; 



WO 2004/022586 



0t 



CT/EP2003/009780 



58 



(xiv) 



(xv) 



(xvi) 



(xvii) 



(xviii) 



(xix) 



(xx) 



(xxi) 



ss-DNA-Molekul mit einer Sequenz der Pbsitionen 51473 
bis 52309 (Domane KR des tubD-Gens) der Sequenz gemafc 
Figur 1; 

ss-DNA-Molekial mit einer "Sequenz der Positionen 53066 
bis 53980 (DoirUine ER des tubD-Gens) der Sequenz gemSB 
Figur 1; 

ss-DNA-Molekul mit einer Sequenz der Positioned 54158 
bis 54460 (Domane AGP des tubD-Gens) der Sequenz gem£B 
Figur 1; 

ss-DNA-Molekul mit einer Sequenz der Positionen 54 461 
bis 55870 (Domane HC des tubD-Gens) der Sequenz gemMB 
Figur 1; 

ss-DNA-Molekttl mit einer Sequenz der Positionen 56000 
bis 57412 (Domane A des tubD-Gens) der Sequenz gemSB 
Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 57413 
bis 57643 (Domane PC P des tubD-Gens) der Sequenz gemSB 
Figur 1; 

ss-DNA-Mole kill mit einer Sequenz der Positionen 58689 
bis 59714 (Domane C des tubE-Gens) der Sequenz gemafi 
Figur 1; 

ss-DNA-Molektil mit einer Sequenz der Positionen 60156 
bis 61697 (Domane A des tubE-Gens) der Sequenz gemafi 
Figur 1; 
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(xxii) s s-DN A-Molekul mit einer Sequenz der Positionen 61698 
bis 61967 (Domane PGP des tubE-Gens) der Sequenz gemaB 
Figur 1; 

(xxiii) ss-DNA-Molektil mit einer Sequenz der Positionen 62127 
bis 63320 (Domane KS des tubF-Gens) der Sequenz gemafi 
Figur 1; 

(xxiv) ss-DNA-Molekul mit einer Sequenz der Positionen 63711 
bis 64 676 ( DomSne AT des tubF-Gens) der Sequenz gemaB 
Figur 1; 

(xxv) s s - DNA-M o 1 e k u 1 mit einer Sequenz der Positionen 64959 
bis 65882 (Domane KR des tubF-Gens) der Sequenz gemafi 
Figur 1; 

(xxvi) ss-DNA-Molekul mit einer Sequenz der Positionen 65985 
bis 67061 ( Domane GMT des tubF-Gens ) der Sequenz gemaB 
Figur 1 ; 

(xxvii) ss-DNA-Molekul rait einer Sequenz der Positionen 67242 
bis 67829 (Domane DH des tubF-Gens) % der Sequenz gemaB 
Figur 1; 

(xxviii) s s - DNA-Mole kttl mit einer Sequenz der Positionen 68247 
bis 69128 (Domane ER des tubF-Gens) der Sequenz gemaB 
Figur 1; 



(xxix) ss-DNA-Molekul mit einer Sequenz der Positionen 69360 
bis 69605 (Domane PCP des tubF-Gens) der Sequenz gemaB 
Figur 1; 
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(xxx) sst DNA-Molekiil mit einer Sequenz der Positioner! 69759 
bis 70586 (DomSne TE des tubF-Gens) der Sequenz gemaB 
Figur 1; 

(xxxi) ss-DNA-Molekiil, das mit einem Molekiil gemSB (i) , (ii) , 
(iii), <iv), (v), (vi), (vii), (viii), : (ix), (x) , 
(xi), (xii), (xiii), (xiv), (xv) , (xvi), (xvii) , : 
(xviii) , (xiv) , (xx), (xxi) , (xxii) , (xxiii) , (xxiv) , 
(xxv) , (xxvi) ,. (xxvii) , (xxviii) , (xxix) oder (xxx) 
unter stringenten Bedingungen hybridisierbar ist und 
insbesondere dieselbe Anzahl von Basen aufweist; 



(xxxii) ss-DNA-Molekai,, das mit einem Molekfll gemaB (i) , (ii) , 
(iii), (iv), (v), (vi), (yii) •, (viii) ,. . (ix) , (x) , 
(xi), (xii), (xiii), (xiv) , (xv), (xvi) , (xvii), 
(xviii) , (xiv), (xx), (xxi) , (xxii), (xxiii), (xxiv) , 
(xxy) , (xxvi), (xxvii), (xxviii)* (xxix) oder (xxx) 
hinsichtlich seiner Nucleotid-Anzahl . oder ; seiner 
Nucleotid-Sequenz zur jeweils 90, 91, 92, 93, 94, 95, 
96, 97, 98, 99 oder 100% homolog ist, jedoch von 
diesem ss-DNA-Molekttl. hinsichtlich seiner Nucleotid- 
Anzahl; und/qder seiner Nucleot id-rSequenz in mindestens 
einem Nucleotid abweicht; und 



(xxxiii) ss-DNA-MolekUl mit einer Sequenz, die zur Sequenz f 

(i)/ (ii), (iii) , (iv), (v), 



eines Molekiils gemaB , v j-jw , v ***m. I-"-*,, \v,, 
(vi), (vii), (viii), (ix), (x) , (xi), (xii) , (xiii) , 



(xiv), (xv), (xvi), (xvii), (xviii) , (xiv), (xx) , 
(xxi), (xxii), (xxiii), (xxiv), (xxv), (xxvi), 
(xxvii), (xxviii), (xxix), (xxx), (xxxi) oder (xxxii) 
komplementar ist . 
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6. ds-DNA Molekul aus einem ss-DNA-Molekul gemafi Anspruch 5 
und einem dazu komplementarem Strang. 

7. Varianten oder Mutanten, die aus einer Substitution, 

Insertion oder Deletion von Nucleotiden Oder einer Inversion von 

» 

Nucleotid-Segmenten eines ss-DNA-Molektils gemafi Anspruch 1, 3 
oder 5 oder eines ds-DNA-Molek\ils gemafi Anspruch 2, 4 oder 6 
resultieren, wobed diese Varianten und Mutanten Enzym-Varianten 
oder Enzym-Mutanten fur die Produktion von Sekundarstof f (en) mit 
fiir Tubulysine charakteristischen Eigensehaften codieren. 

8 . RNA 

(a) mit einer Sequenz entsprechend der eines ss-DNA-Molektils 
gemafi einera.der Ansprflche 1, 3, 5 oder 7 oder 

(b) mit einer Sequenz einer RNA gemafi (a) , aber in 
Gegenrichtung (anti-sense) , oder 

(c) mit einer Sequenz einer RNA gemafi (a) oder (b) und mit 
einem dazu komplementaren Strang, 

jeweils gegebenenf alls als Element eines rekombinanten Vektors. 

9. Rekombinanter Vektor, insbesondere Expressionsvektor mit 
einem DNA-Molektil gemafi einem der Anspriiche 1 bis 7. 

10. Zelle, insbesondere zur Expression, in die ein DNA-Molektil 
gemafi einem der vorhergehenden Anspruche oder einen Vektor gemafi 
Anspruch 8 oder 9 integriert ist. 

11. Zelle nach Anspruch 10, wobei sich die Zelle von 
kultivierbaren Bakterien, insbesondere Myxobakterien, 
vorzugsweise Angiococcus, insbesondere A. discif ormis, 
Archangium, insbesondere A. gephyra, Escherichia coli, 
Pseudomonaden oder Actinomyceten herleitet. 
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12. Verwendung eines Vektors gemafi Anspruch 8 oder 9 f Or die 
Transformation von Zellen oder Organismen zur transienten oder 
permanenten Expression eines oder mehrerer Proteine 
(Expressionsprodukt (e) )., das (die) durch eine-DNA (ssDNA oder 
dsDNA) des Vektors codiert wird (werden) . 

13. Verwendung einer Zelle gemaB Anspruch 10 oder 11 zur 
enzymatischen Biosynthese, Mutasynthese oder Partial-Synthese 
eines Tubulysins, insbesondere Tubulysin A, B, C, D, E und/oder 
F. 

14 . Expressionsprodukt eines DNA-Molektils gemSB einem der 
Ansprtiche 1 bis 7 oder eines Vektors gemaB Anspruch 8 oder 9 
oder einer Zelle gemSB Anspruch 10 oder 11. 

15. Polynucleotid enthaltend eine Sequenz wie in SEQ ID NO: 1, 
18, 33 oder 36 definiert, oder ein Fragment davon. 

16- Polynucleotid nach Anspruch 15, wobei das Fragment eine im 
Sequenzprotokoll definierte CDS ist. 

17* Vektor enthaltend ein Polynucleotid nach • Anspruch 15 oder 
16. 

18, Zelle enthaltend einen Vektor nach Anspruch 17. 

19. Polypeptid enthaltend wenigstens eine Sequenz wie in SEQ ID 
NO: 2 bis 17, 19 bis 32, 34, 35, 37 und/oder 38 definiert 
und/oder ein Fragment und/oder Derivat davon. 
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20. Verwendurig wenigstens eines Polynucleotids wie in SEQ ID 
NO: 1, 18, 33 urid/oder 36 definiert und/oder wenigstens eines 
Fragments davon und/oder wenigstens eines Polypeptids wie in SEQ 
ID MO: 2 bis 17, 19 bis 32, 34, 35, 37 urid/oder 38 definiert 
und/oder wenigstens eines Fragments da von zur Herstellung ether 
pharmazeutischen Zusammensetzung zur Behandlung von 
unerwunschtem Zellwachstums oder unerwtinschter Zellvermehrung in 
einem Individuum. 

21. Verwendung nach Anspruch 20, wobei das unerwunschte 
Zellwachstum oder die unerwunschte Zellvermehrung ein Tumor 1st. 

22. Verwendurig riach Anspruch 20, wobei das unerwttrischte 
Zellwachstiim eine pathogene Infektion ist. 

23. Verwendung nach Anspruch 22, wobei die pathogene Infektion 
eine Mykose, Malaria oder eine parasitare Erkrankurig ist. 

24. Pharmazeutische Zusammensetzung, enthaltend wenigstens ein 
Polynucleotid wie in SEQ ID NO: 1, 18, 33 und/oder 36 definiert 
und/oder wenigstens ein Fragment davon und/oder wenigstens ein 
Polypeptid wie in SEQ ID NO: 2 bis 17/ 19 bis 32, 34, 35, 37 
und/oder 38 definiert und/oder wenigstens ein Fragment davon. 

25. Pharmazeutische Zusammensetzung nach Anspruch 24, die 
weiterhin wenigstens einen pharmazeutisch vertraglichen 
Tragerstoff enthait. 

26. Verfahren zur Herstellung von Tubulysinen und Tubulysin- 
Biosynthese Proteinen, umfassend die Schritte: 

(a) exprimieren von wenigstens einem Polynucleotid wie in 
SEQ ID NO: 1, 18, 33 und/oder 36 definiert und/oder 



i 
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wenigstens einem Fragment davon und/oder wenigstens, 
einem Polypeptid wie in SEQ ID NO: 2 bis 17, 19 bis 32, 
34, 35, 37 und/oder 38 definiert und/oder wenigstens ; , 
einem Fragment davon, und 
(b) aufreinigen der Expressionsprodukte .. •. 

27. Verfahren nach Anspruch 26, wobei die Expression in 
prokaryotischen oder eukaryotischen Zellen und/oder durch in 
vitro Expression erfolgt. 

28. Verfahren zum Auffinden von Genen, die an der Biosynthese 
von Tubulysinen beteiligt sind, umfassend die Schritte: 

(a) hybridisieren von wenigstens einem Polynucleotid, wie in 
SEQ ID NO: 1, 18, 33 und/oder 36 definiert und/oder 
wenigstens einem Fragment davon mit DNA, RNA, und/oder, 
cDNA einer Spezies, die nicht mit Angiococcus 
disciformis identisch ist, und 

(b) isolieren und charakterisieren der hybridisierten DNA, 
RNA, und/oder cDNA. 

29. Kit zur Herstellung yon Tubulysinen, enthaltend: 

(a) wenigstens ein Polynucleotid nach Anspruch 15 oder 16 
und/oder wenigstens einen Vektor nach Anspruch 17 

oder ...... 

(b) geeignete Medien und Puffer zur Vermehrung von Zellen, 
die eine Expression des Polynucleotids und/oder Vektors 
erlauben und 

(c) geeignete Mittel zum Aufreinigen des/der 
Expressionsprodukte (s) . 
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30. Verwendung einer Zusammensetzung enthaltend wenigstens ein 
Polypeptid wie in SEQ ID NO: 2 bis 17, 19 bis 32, 34, 35, 37 
und/oder 38 definiert und/oder wenigstens ein biologisch aktives 
Fragment oder Derivat davon als Desinf ektionsmittel. 

31. Verwendung nach Anspruch 30, wobei die Zusammensetzung 
flussig oder pulverf 6rmig ist. 

32. Desinf ektionsmittel wie in Anspruch 30 oder 31 definiert. 



) 
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Figur 1 sequence listing 

<110> Gesellschaft fuer Biotechnologische Forschung mbH 

<120> Tubulysin-Biosynthesegene 

<130> 13289 

<160> 1 

<170> Patentln version 3.1 

<210> 1 

<211> 70782 

<212> DNA 

<213> Angiococcus discif ormis 
<400> 1 - 



gcggccgcct 


tcttcaccgc 


gggggcctcg gcctcctcgg 


tggtcggggc 


gggcgccagc 


60 


ttgtcgccgt 


gcaccttgcc 


gggagcggtc gccttcttct 


tcgaggcgga 


gcgcacgggc 


120 


tcgccctgcg 


tcacctcgcg 


cgtgggcagc atgtccccgt 


gggccttcac 


cgggccggac 


180 


tcaccctcct 


ccgcctcggc 


gccctcggcc ggcgtctcgc 


gggtgtcgcc 


accctccttg 


240 


gcccggttga 


actcgcgcat 


cgcgtcgtcc accagcccca 


tggtcatgta 


cgccacgccg 


300 


aggtcatggt 


ggtcggatgg 


cgacaggccc tccttcgtgc 


cctcgcgcag 


cttcgcgagc 


360 


gcgtcctgca 


cctgcgtgtc 


cccggcctcg gacgcggtgc 


cggtctcgcc 


cagttcaccc 


420 


ttcagctcct 


ggcccaggtc 


cacgccgccc ttctcttcct 


gattcggggc gaccttcacc 


480 


tgggccgggg 


cggaggggga 


ggcaccctct tccgcggtgg 


gggtgctgct 


ctcgggagtg 


540 


gtgctctcgg 


acggcggcgt 


ctctggcatg gcgggctccg gggcaatccg ctgcaggtgg 


600 




y V-- w. ^- y 


ctccttcagc tcctcgacgc 


gggcgcggtc 


cttctccacc 


660 


acgtccgggg 


gcgccttggc 


cacgaagttg gggttctcca 


gcttgcgcag 


cacgccggcc 


720 


atctcctgct 


cggcgcgggc 


aatctccttc ttcaaccgct 


cgcgctccgc 


gtccaggtcg 


780 


acgaggcccg 


ccagcgggac 


gtagatctcc aggttggagc 


ccacgaaggc ggcggcctgc 


840 


ggcggcttgg 


cgcccggcgc 


tcccaccgtc acctcggaca 


ggccggccag 


cggcatgagg 


900 


tagccgcgcc 


agcgctccag 


cagctcgcgc gtgcgcacgt 


ccgcgctctg 


caccaccgcc 


960 


ttcaccttgg 


tggcgggcga 


caggttgctc tcgccgcgga 


tggtgcgcag 


gccctcgatg 


1020 


gcggcgatga 


ccggcgccat 


ctcgccttcc gccgcctcgt 


ccacgtgcgc 


cgcgtccggc 


1080 


tccgggtacg 


gggcaatcat 


gatgctgtcc gtcggccggg 


ccatcggcag 


cttctgccag 


1140 


atctcctcgg 


tgatgaacgg 


catgaacggg tgcagcagcc 


gcaggatgcg 


gtccaggcag 


1200 


tacacgagca 


cccggcgcgt 


ggagtccttc gccgccgcgt 


cctcgccgta 


cagcgagccc 


1260 


ttcgccagct 


cgatgtacca 


gtcgcagaac tccgcccaga 


ggaactggta 


gagcgtggag 


1320 


gcggcctcgc 


cgaagctgta 


cgactccagc agcgcgcgcg 


cctccgtggt 


ggcgcgctgg 


1380 
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aggcgggaga 


gaatccagcg 


gtccgccagc 


gtcagtgtgc 


tccggtccag 


cgggccggcc 


1440 


tccatccgga 


agtcgcccat 


gttcatcagg 


gcgaagcggc 


tggcgttcca 


cagcttgttg 


1500 


ccgaaggcct 


tgtagccctc 


gagccggtcc 


atcgacagct 


tgatgtcgcg 


gccctgctgg 


1560 


gtgagcgagg 


cgagcgtgaa 


gcgcagcgcg 


tccgcgccga 


acggcggcat 


gccctgcggg 


1620 


aaccggttct 


tcagcgtcgg 


ctggagcttg 


tcggccgggg 


cgccgaggac 


gatgtccagg 


1680 


gggtcgatga 


cgttcccctt 


cgtcttggac 


atcttctggc 


ccttctcgtc 


gcgcaccatc 


1740 


gcgtgcaggt 


acacggtgcg 


gaagggcaca 


tcccccatga 


agtggatgcc 


catcatcatc 


1800 


atccgggcga 


cccagaagaa 


gatgatgtcg 


tggcccgtct 


ccatgacgga 


cgtcgggtag 


1860 


aaggtcttca 


gctccggcgt 


ctcacgcggc 


cagcccagcg 


tggagaacgg 


ccacaggccg 


1920 


gacgagaacc 


aggtgtccag 


cacgtccggg 


tcctggatga 


aggacgcgcc 


gccgcacttc 


1980 


gggcaggact 


tcggctgctc 


gcgcgcgacg 


atgggctccg 


cgcgcgcgaa 


gtccaccccg 


2040 


cccaccttca 


ccgtgggggc 


> 

gtccagcggc 


aggtccgtgt 


cgtcgccctg 


ccgcgggctg 


2100 


cacgaggtgc 


agtagtacgc 


gggaatctgg 


tggccccacc 


acagctggcg 


gctgacgcac 


2160 


cagtcgtgga 


tgttgcgcat 


ccagtggaag 


aacgtgttcg 


tccaggactc 


ggggacgaac 


2220 


ttcgtgcggc 


cctgctccac 


cgcctcgatg 


gccggcttcg 


ccagcggttc 


aatcttgatg 


2280 


aaccactgcg 


gagacaggcg 


tggctccacc 


accgtggcgc 


agcgctggca 


ggtgcccacg 


2340 


ttcagcatgt 


ggggctcttc 


cttctccagc 


agcccctgct 


ccgtgaggtc 


cgccagcacc 


2400 


tgcttgcgcg 


cctcgaagcg 


atccatgccg 


gcgtacttgc 


cggtctcctt 


cgtcatccgg 


2460 


gccgcttcgt 


ccaggatggt 


gagcatgggc 


agcttgtgcc 


gcaggcccgt 


ctggtagtcg 


2520 


ttgaagtcgt 


gcgccggcgt 


caccttcacc 


acgccggtgc 


cgaacttcgg 


gtccaccagc 


2580 


tccgcgtccg 


cgatgatggg 


aatctcgcgg 


tcggtcagcg 


gcagcttcac 


gctcttgccg 


2640 


gccagcccca 


ggtagcgctc 


gtcctccggg 


tggatggcca 


ccgcggtgtc 


gcccagcatc 


2700 


gtctccgggc 


gtgtggtggc 


cacggtgagc 
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acgctgctgg acctggcgga ccgggccatg taccggggca agcgtggctc ccggaatgtc. 
gtctacatgg cggccctgga tctggagccg ctgccggcgg agcggcgcca gggcggcagc 
ggccccggcg gctccagcac gtagcggctc agcggcgcag gttgcccacg gtgaggcgct 
tggtcggggt ggtctccacc tcggcgcgtg ctcccccgcc ctccttgccc accgcctcca 
cctcctcgtg cggggcaccg gtggtgatga gccggtactt ctccgaggcc tcgcggtcat 
gctgggcctg ctcggggtcc aaccgggcaa tcagctgcca gaagagggcg gcgtgctcgc 
gctcctcgtc catgacgtga cggaggatgg ccttggcctc ctcgttgtcg gtggcatcga 
tgtgggcggc gtagaggttg atggcgtcca gctccgcctc gatgttcagc cggatggagc 
gggccagctc ggagtcggtc atcttccggg gcaccagcga gtggaacggg ttggtctgcg 
gcatgaaggc cctcccgagg ccggtggtgg cgtccacgtt ctggacgggg cgccagggga 
cgcgaggagc atccgcgcgg ccaggggccc gggtcaacgg aatccctccg cccgcgttgc 
gtagataccg ctgcctccgc catgctcggg ccatggaaac acccgcgccg ctctcccagt 
tgctccaggc cctggaggcg ggagatctgc cggccgcgcg cgcggcggcg gcggctctgc 
aacgtgcggg cgcgcactcg gcacagctgg cggcggaggt gctgcacgag ctgcggcagc 
ccctgctggg cgtgaaggcc tacgcgcagc tgctcgcgga ggacggtggc cccaccggcc 
cgctgcggct gctgctggcg caggtggagc ggatzggaaca gatcgtctcc gactacatcc 
gcctcgccag cgagcggcac gcgccgcagc agcgcctgtc gctggcggcg cccatctggg 
cggcggcgaa gctgttcagc gtcaacccgg actcggcgcg catgtctctg gaggtggagg 
cgcccgagga catcaccatc cagggcaacg cgcggctcat cgagcagctc acgctgaacc 
tgctgaacaa cgcgcgcgac gccatggccg gccgcgggcg cgtgaaggtg gtgctctcgc 
gcgagggcgc ctctccggtg ctgtacgtgg cggactgggg cccgggcatc cccgtggagc 
tgcgcgagcg catcttcgag ccctacgtca ccgccaacaa gcgcggcacg ggactggggc 
tggcggtgtg caagcgcatc gcccaggagc acaacgcgac gattggcctc gcggcgccgg 
gcgccattcg cgacgtgccc ccgccggcca ccgtgttccg ggtacrtcttc cccgccacgg 
acgcgccgcc gcagctgcgc aagcggctgc tggtggtgga cgacgagacc atcatccgca 
tggtcttccg cgacctgatg ggcaaggagt gcgaggtcat cgaggcggcc agcggcgagg 
aagcgctgga tttgctgcgc caggcgccag tggacctcat cgtcacggac aagaacctgc 
cgggcctgtc cgggctggag ctggcgcagc aggcgcggcg gctctactcc aactcgcgcg 
tcatcctgat gacgggctac ccgtcgctgg tgacgacgca gcaggcgctg gagctgggcg 
tggtggacta cctgctcaag cccttcgacg acatccggca ggtgcgcggg ctgttgcgca 
cgacgctgtc ctcggagccg ccggtgcctc cggtggtggc ccccggggcc gaagtgcggc 
gggtggacgt gctggaggac aacccgacga cggcgcggct catctccgag gccctggaca 
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cgaaggatgg cctcacgcgc 


ggactggtgg 


aagaaaatct 


12180 


ccttcgctgc 


catcgcaacc 


tcctgaaatt actgggggat 


ttaactgtga 


cgacgctggc 


12240 


cgttagcact 


cggccatggc 


gagcgceaac ataagggcca 


gcgaaatgat 


gtcaaccagg 


12300 


aagggcgtgc 


ctgtgggcga 


gcggacgggg ccagggcccc tcggggccgt 


ctggccgggg 


12360 


ggctactcgg 


cgaagcgcac 


gaggttgagc agctgaccca 


tgtccagggg 


tttgcgcagc 


12420 


gtcagcgcca 


cgcccttgcg 


caggccccgg tcggtgacgc 


cctcgtcctg 


ggcgcccgtc 


12480 


atcagcagca 


cgggaatggc 


ctggaagcgg gggtcggcct 


tgagcatctc 


cgtgaagtgg 


12540 


atgccgtcca 


ggtggggcat 


gaggtaatcg gtgatgacca tgcccacctg gttgcgctcc 


12600 


aggatgtcga 


gcgcctgcag 


ggcatccgcc gccgagtaga 


ccgtgtagcc 


atgcatctcc 


12660 


aggaagcgag 


agagcatggt 


gcacagctcg agatcgtcat 


cgacgacaag 


gatgttcacg 


12720 
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gggcgggccg tcacacatgg acgggcgccg gaacctaaca gccgtgcccg tcgttgacaa 12780 

cgcacagcgt gccttcatat gtgccggccc atggggaagc ggaccgcgaa gcgagagggg 12840 

gtgggtggcg tggaggctcg gctggatgcg gtggcggacg ctttcgaggc cggggacttc 12900 

gaggccgcgc tggccggggc ggagggcctg ctggcggacg cgcccgagct tcccgaggcc 12960 

ctccacttcc gggcttcggc cctggtggaa ttggggcggc tggaggaggc cgggaaggcc 13020 

ttcgggcagg ccctgaaggt ggcgccggag gacctggaaa tcctgctgag cgccgcggac 13080 

tgcctggtgt gccgcgccgg ggaggaccgg gaggcggtgg cggaggggct cgccctgtgc 13140 

gcgcgaggcc ggcgcctggc ccagaaggcc gacgacgtgg agatgctgta cgagttcctc 13200 

ctcctggagg gcatggggct caaccagatg ggcgagtgcg ccacggcgct ggtgagcctg 13260 

gacgcggcgc tcggccacat gccgcgctcg ctggacgcgc aggtcgagcg gggcatcgcg 13320 

ctgttcgagc tgtgccgctt cgacgaggcg aaggccgctt tcgagaaggt gctgaaggac 13380 

gcgccggacg acccgtgggc gcaccactac ctggggctca tcgccgagcg gcgcggggac 13440 

gagaaggagg cgaagcggcg cttcgacaag gcgcgggcgc tggtgcccga ggagttcccc 13500 

ccgccggtgg agctggccga ggcggagttc gaccgcgcgg tggaggacgc ggtgaagtcc 13560 

ctgccccgcc acgcgaagca gtacctggac aacgtcacca tcgccgtgga ggacctgccc 13620 

tcggacgagg atttgctggg gcaggacccg ccgctgtccc cgagcatcct cggggtgttc 13680 

cgcggcacgc ccgtgggcga gcggagcgtg at:gaacgcgt atgagctccc cgcgtccatc 13740 

gtgctctacc agcgcaacct ggagcgcttc gcgaggacgc gcgaggaact catcgagcag 13800 

attggaatca ccgtgatgca cgaggtcggt cacctcatgg ggctggatga ggacgacctg 138 60 

tggcagcggg ggctggactg acgagcgagg cccgcgtggc ttccagcgtc tggcggatgc 13920 

cctcgctgta gggcgtcttg cgcacgctgc ccagcagctt gtgcagcgcc gagtcgtcca 13980 

tgaggacggg ctcggtgagc aggtagtgca tctcgaccat ctcgcgcatg aacgggttga 1404 0 

agaggccgat gaggcggagc atccccttcc ccgccgtcat gaacttcgcg aggtggccgg 14100 

cctgggcgta gatctcctcg acgagcttgc gctgtgaggt gacgccggcg ccggcgaggt 14160 

tccaccagcg gccgtaggca ccgggggcgt ccatgagggc cgtcacggtg ggacccacgt 14220 

cgggcacgta gacgtactcg tgcggcgggt cgatggggcc gatgagctgg gcgcgcttgc 1428 0 

cctgggcggc ggcgacgaag gcggagtgga ggaagctctt gtcgatgccg gggccgtaga 14340 

agtccgggag gcggaggatg gtggcgcgga gctttccggc ggcgtccgcg gcgaggagga 14400 

tgtcctcctg ctccttgcgc atgcggccct tgaaggtgtg cggctcgcgg gggtggtcct 14460 

cggtgacggg cgtggtgcgg gggcggccgt acgggtacac ggtgccgatg agcaccacgc 14520 

gctcgacgcc ctcggcgatg gcggcgtcca cggtgcggcg catgagctcc gggtggagct 14580 



WO 2004/022586 ^^CTYEP2003/009780 

9/38 

ggaagcgcca gtagtccacg ccgaccatgt agatgagcgt gcggatgccc cgggcggcgg- 14 64 0. 

cgcggatggt gtccggcgcg tcggggttcc aggtggcgat ctccgccttc gggtccgcgc 14700 

cgaactgcga ctgaagcgag gcgcgcgagc ggccaaccac ccggtacgcc ctcccctgct 14760 

cgcgaagagc cttcacgatg ctgtgtccga tggggcccga cgctccaaac aacgccacct 14820 

tgtccgtatc catggtccgc tccctgggtt ccgaacggcg agcgttttat gaacgtcgtt 14880 

cattgtgaac ggtgttcatc tactgctggc cgttcaggac gtcaagccct acagtgggga 14940 

tatggggatt tcggagcgga aggagcgcca gcgggcggag ctgcgcgagc agatcctcca 15000 

ggtggcgaag gacatggtga cgcgagaggg ctttggtgcc ctctcgatgc gcaagctggc 15060 

ggacgcggtg gagtacgcgc cggcgacgct ctacctgcac ttcgagaacc gggacgcgat 15120 

tgcccgggag ctgtgcatcc gggggttcca ggacctgctg gaggcgttcg agccggcggc 1518 0 

atccgtggag gagccggtgg agcggctgta ccggctgggc^ gaggcctacg tgaagttcgg 1524 0 

gctggagcag ccggagacgt accggctcat cttcatggag gacccgaagc tgtcgacggc 15300 

gctgttcagg gacgcgccgg aggacggcgc ggggccgcgg tccttcgggg tgctggtgaa 15360 

ggtgttcgag gacctgaagg cggcggggag gattgccgag gacgccgagc cctcgaagct 15420 

ggccgaggtg ctgtgggccg gggtgcacgg catcgtggcg ctgcggctga cgtgtacggg 15480 

cttcaagggc tcgccgccgg aggagctggc gcggctgttg gtgtccacga tggtgaacgg 15540 

attgccgggg ttgaagcccg tgaaggcggc gcggaagaca cggtgagccg ggcgttggHt 15600 

gacggggccc gtggggtgcg gcagtaatcg acggtggtag ggcctccgga cctggtggcc 15 660 

ggcccggtct tcaaaaccgg tgaggggcgc tgagaggcgt ccctggtgag ttcgattctc 15720 

atgctctacc gccatgtttt ccttggggtt ttctgacgcg gccctgatcg ggttgcagga 15780 

cgccccaccc gcctgtacct ctcgtaccca agttttaccc aagtgagggg ggtacgggag 15840 

ccgcgcatga cgaagtggag cgggaagtgg atcggaggcc gcacgtacac ggccaccgac 15900 

ggaagcacgc gctggatcat ccgcaagacc gtcgccgggg tcgcgtacaa cgtcacgctg 15960 

gacgtgcgga gcgaggccga ggccctggct gagctggcgg ccttccgccg caacccggcc 1602 0 

gcgtaccgga ccgcgagcca ggagcgccaa gacgaggccc aacaggccca ggaggacgcc 16080 

gcgcaggcgg tgttcctgga cgaggatcgt gcccggcggt tcctccagca tctgaagtcc 1614 0 

agcggcaggt ccgacgagta cctgaagagc acgcgcagct acctggccgc gtgggcaacg 16200 

gcgctcgcgg acaaggacct gcgcgcggtg accggaccgg cgttgaagaa gatcctggcc 162 60 

acctgggaca ccggcaagaa gtggaggatc atcgtcttca agtccttcac ctcgttcctt 16320 

caggactcgg gcgaactgga cccgatggtg aaccccggac gcttcctgaa ggtcccccct 1638 0 

gcccgccgga accacgaact caagggctac agcatcgagc acgtccagca gctctacgcg 16440 

gccctcggct cgcaggccat ccgcgatgtg ctgtgccttc aggccaagac cggg atgca c 16500 
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ggcaccgagg tggaccggct cgcgagcggt gacggcaaga tcgcggtgct gaaggaccag 16560 

ggcgagatcg ccgccaccgt cacgttcaag cacaagaccg ggaagccgtt caccttgtcg 16620 

ctcgatgtgc aggggctcgc cgccgcccag cgccttcaag cccggggttc agcgccggat 16680 

cggcagacca tccgcgaggc cgtggagcgc gtgtgcgcgc gcacgagcct ggagttcgtc 16740 

cacttcggcg cgatccggca cagcttcgca acgtggctgg tcgagcaggg cagcatctac 168 00 

aacccgaagg gcggtggcct gtccctggaa gccgtcgctc aggcgctcaa ccacagcagt 16860 

acgcggacca cggccctcca ctacgtcagc gccacagtgc cgccgatgta cgtcgtcccc 16920 

atccgcctgg agcattcgaa tgatccatcg gagttgcgca tagctcgggc acctgcgggg 16980 

tgaggctcat gaaccagaga gttcggagat cagtacgagg aggttcgttg atgcgtcagg 17040 

ccccaggccg gagccttcaa cgttcttatt gcgccgaacg ctccaggtga ttaccgcacg 17100 

cctcccacaa aggagccatt cgatgcagat cctggccgta accgaacctc ctagtttcgg 17160 

ggggaagtgc accatcaccg acgtggcggg caacgttgtc gggtacctcc acctgcgcgt 17220 

gtcctcgatg ctcaacggca gtgcaggagt cgtaaccgat ctccatggcc gcgccctcat 17280 

gcaggcgccc ttcaactttg gggtgtggga tctagaaacg cgacggaggg tcgcgatcgc 17340 

gttcgtcgag gcggccttcc cggagactcg cgccgcaatt gccggagcca agccgaccag 17400 

agcccccatc acggttgcgg agttcggagg cgtgctgcgc tcgctgctcc cttccacgcc 17460 

cactcacccc gtcgggacta ttcccgcgtc cattccgatc gacgccatca acatcgttgc 17520 

ggcggacctg tacccgaacc ggacctgcga tagggagcac ttggaagagt tgacgaaggt 17 580 

gctcaacacg gagttggagg cgcagtaccg cacgcgcctg gagtggtcag gagacacgct 17 640 

gcacctgcgc gccaagtaga ccatcggccc ctcgggcgcg gccagcaaag tctcttcctt 17700 

gatcgaggag taggatgcgg cgaactacgc ctcgatcact gccggatcat tcttgtcacg 17760 

atgtcggggg gttagagcgt gtcgatccgg ctgcggatgc caggacaaga agttctgcct 17 820 

cctctatccc gttgggccat gtcgaggggc accaaaaccc tcgctcgtga gcttcggccg 17880 

cttcgttacg gcgactttca acgaggctca aatcgtgagc ttgcggatgg caacacctgg 17940 

gttcggatac gctccggctg cggttccctc ctgcttccca cgccgctcct tggtgcggac 18000 

tcgttcaggc tgcttggttt gttgaggccg attgcctccc ttccgagggg cgccctccgc 18060 

gagcagtgcc tcgatgctcg ccaccgtgat catcacggac cgtccgatct tcggtgcccg 18120 

ctccaaccgg ccttgctcca ggagcttgaa gacctgtgac cgcttgcagc cgagcattgc 18180 

cgacgcgcgc tccagcatca cagccgaggc gttctgtgtg accgattgag cgcgaagcgc 18240 

acgaacctcg cgcttgatct cggccagttc ctggaggatg gcgcattcca cgggtgcggg 18300 

ctcgtggtcc tcaatgggca cggcaggtcg aaagactgga atgggaatag gaatgaggtc 18360 
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caacggtggc 


tccggccgag 


caagcaagga 


gcctgtacgg 


atatagctga 


agttctcgat _ 


18420 


catggacttg 


tactcaaccg 


gtctccgtcg 


gaggccgtgg 


atggtgtcga 


aggtgtggat 


18480 


cgagccggtg 


gccaccagtc 


cgtccctatt 


ctgaatgtat 


cgaatctctc 


cgaggtcctt 


18540 


ccgggcgctc 


gccctgcccg 


cctccgtgcc 


ggtgaag.gcg 


. i. 

aacgggaggc 


gcttggcccg 


18600 


gcacctgagc 


cccgttggac 


gccatggatg 


gcccggaagg 

7 7 7 — ' ~ 


< •■ 

gtcacagcac 


cggctacrttc 


18660 


agccctttac 


tcgtgctgcg 


gcgtcatcgt 


cctgacttcc 


ccatagcctt 


ccatcccttc 


18720 


cgatccttcc 


acctctctct 


gcaaccaggg 


ggagaccgaa 


gcagacagca 


tggaaggcat 


18780 


cgccgcagtc 


ggaacgcatc 


cgttccaatc 


acgggtgcgc 


aaggtccatc 


cgagcgccag 


18840 


cggcgatgct 


ctccatcacc 


ccgtcgatct: 


cggtctccca 


gcgtttcacc 


gtgacccggt 


18900 


acttgattcc 


atcgctccgc 


ttccagicccg 


tgttctcttc 


accggccaac 


tccttcatgc 


18960 


gttcaccgaa 


cttcgtgagc 


gagaacgcca 


tccggtcacg 


gccctggtac 


ttcaagtcct 


19020 


cgacgtagtg 


gccgtacagc 


gccgtggcct 


tgatccactg 


gtcccgctgc 


gcgcaccggc 


19080 


gctcgaagaa 


atcttccacc 


gagtccttgg 


ctcgaatctc 


atcctggcgg 


gcctggacct 


19140 


gcgccaattg 


gccgaggagc 


gggctctccg 


ccttctcgtc 


cacgctcgtc 


cacatggcca 


19200 


ggaagtcgat 


ctgctccagt 


gccgtccagt 


tcatctgggg 


cagacagtcc 


agttgataga 


19260 


agcgtcgcat 


tcccgtggga 


tcgacgacga 


tctccttcac 


ctgcttgttg 


gacgcaccga 


19320 


tgaaggtggc 


gttgttggtg 


ccggtctgga 


gcttctggac 


accgagcacc 


cggtactcga 


19380 


tccgctcggc 


ggtgatgcgg 


ttcttgagca 


cgtcagacgc 


tacccgctct 


gccttcgcca 


19440 


tttcgtcgaa 


gaacatgccg 


tagcagcgag 


tcaaccggaa 


ctgctggcgc 


tcatcggtca 


19500 


ggaactggag 


atcggcgggg 


aacccaacga 


gatcgccaag 


aggctgtagc 

7 7 7 7 


aggctcttga 


19560 


tggccgtagt 


cttcccgccc 


cgctgtttgc 


cgacgaagat 


cggcatcagg 

^ 7 7 7 


tggtccttga 


19620 


ccggcttccc 


gaacaacttc 


cgcttcacct 


gccaaatgaa 


gtgaagaacg 


accacgagat 


19680 


ctaccgggtc 


aagg<igtccc 


gtggttgctc 


gaatgaactc 


ctcggcgtca 


cctcggcgtc 


19740 


cgtcctcgcg 


gaacttcaac 


ttctcacgat 


actgctcgac 


gatcccccgg 


cgttggtccg 


19800 


cctcccacag 


gcgcacggcg 


ttaccgagat 


ttcgcacgct 


gatgcatgtq 
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cgctcgttcg 


19860 


tggactcgat 


ctcgatctgg 


gacaagaact 


cggacgcagg 


aaacatccgg 


cccccaatct 


19920 


ggaagccatc 


gctcgcgtac 


acgaatgtga 


cgccgttctt 


ctccatccag 


tgttgaaccc 


19980 


atgtgcgcgg 


ctcgaagcgg 


ttctcgaccc 


tcggcaacgc 


ctgcaccaat 


cggtcgatga 


20040 


cctcgggctt 


gcagaccttc 


ttcctcttca 


aggtcccgac 


ccacttcttg 


aagatgccat 


20100 


gctcggtgga 


gaaccaaacc 


gagcaccaga 


cgagagcgcg 


ctrbgatctcg 


atctccttca 


20160 


ccccaccgtg 


cgcctcatgc 


tgttccacga 


gccagtcaca 


y a y Ly ouy aa 


ggaagcgccg 


20220 


ggcgcgcaga 


ggccaagtac 


tgcacgatca 


ggaactgacg 


agcccatgct 


tccgtcttgt 


20280 
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ggtgatgagc ggcaagcaac ttcttcatct cgcgatgcac ccaatcatcc acaccggatt 2034 0 

tctcgtgctg tgggtcgtgg tccacgtacg gaatctgagg gtcacatccg cgcgcagaaa 20400 

ggcccttcgc gatccgcaca acttcacgaa cgacgttcat gttcgtgccg tccatgtccg 20460 

gcgcatcgcc gcagacgaac accgtgcggc cctgtgcaag gtatgatgcg gcctcggggt 2052 0 

gcggtaccca ctcgtccgtc aggtcatccc agcttcgtcg ccgggcctca acatcatggg 20580 

ccatgctgat gccggggagc cccagcgccg gggtgccttc ctgcgcgagc agcgccgcct 2 0640 

tcttctcgcc ctcaatgagc gccatgggga cttcttcgtc ttgaagcatc gggcagagga 20700 

tcgcggtgtc gaagatctgg ggcgcgtacc cgaaaggagc ctcgtacttc ttcaccttcg 2.0760 

ctggctcccc ttcgacctca tcctgggtgt acgggcgcag gatgtggtcc gtgaaggtcg 20820 

cggttgggag ggtgagctgc gcctccttcg gccggagcac gcgcgggcga tgcggcttga 20880 

ccttggcgta gttgagcccc gggtacacga gcaccagccc tccagcgtcc cccttccatt 20940 

cctcgggeca gttcaacaac ttccggttgt tctcgtccgt gtccgttcgc caaccgagtt 21000 

tccgcaccgt cgagggcagg aggcaggact tcttcaggtc ctcgcagtct cgcgccgaga 21060 

tcggaagctc gttccactca gcctcgttgc ggctggattc aacctcgttc gccttcgagt 21120 

cgggcagtgc cttgtccgag tcctcatgtc ccattgggta cacctctccc atcaacgccg ' 21180 

aagccgtgct tcgacgcctt gaaatgcagg gtggctcttg aacttgtatc gattctggct 21240 

acgtcgttgc ggcgccctgg agcggagccg ggttcggtgt ggctacaagg aatatatcga 21300 

atgtgtctgc gcacctcgga cggtgcgccc cgagggccac gggcatcaac gccgctgcgc 2136.0 

gatcctgcgc cgtggacggc caggggattc gcgacgtaca ccggacggca accttccgtg 21420 

tatgagccga ggcacccgct ggagcacgga gtacctggac gcgatgctcg cggcetggga 21480 

gaggtccggg ctgacctcgg agcagttcac ggccacggcc gcgccagggc tgcctgcgcg 21540 

taccctacgg ctgcaccgcc agcgaaaaga gaaggagatc cacgcagagc ttcagcggct 21600 

tcgggatgaa aacgcgacgc tccggtcgat gctcgaaagg agcgcgttgg tccctggtgg 21660 

ttgccgggcg gcaaccgtca gcgaccccaa cggccacggc attggagatc gccatgtggc 21720 

aaacggaacc gaagcccctt cgccgaccgc gaccggcccg ccagcattgg agccggtaca 21780 

gccgcgcgtg gtgccgcagg accaggttgc cggaccctcc cccggtgatc acgatggtcg 218 4 0 

tgtgctcgta ggggaaatca ccgagccggt gcccccgaag agaccggcgt tctcctggga 21900 

ttgatggcct cgcgcctgct ggccgatgtc ggacgccatc taccgctggt cttggtccgc 21960 

gagcgccttc aagagcttct tgatctcggc cgaggacatc gtgcggatgc ggtccacgag 22020 

gcgttgccgc tcgtcatcet cgggaaacgt caggagatcc agcggcaaca ctcccaggtg 22080 

gtccgccagc accttcaacg tgcgaaggcc aagctcctgc ggccagtgct tagaggtggg 22140 
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actcagggca cggagcagag gcagagcgcg agcaccaggc -aggcgctccg ccgcgctcac- 22200 

cctgccgagc cctgtggtcg cttgtaatac cctttgggtt tatgaatagt agacctcgga 22260 

ccgcgagagc caccggcccc gtccccctca gccgaggccc caccagggag ccggaaggcc 22320 

cgagccagtg cccgccgcgc gtcccttccc acctggaggc cgcacatgac cgatgacagc 22380 

acgccgaccg acgaaacgca gatcgaggcc ccgacgccgg agaacacctc cgacctgaag 22440 

ggcgcccgcc cccgactccg gttcaccatc gagaccacca cgtacgagac cctccgcacg 22500 

ctggagcggc ggggtaacgg cgaggtggtg ctcctggccg agcgtcacct cccccatgga 22560 

ctcgccgggc tcgtcaccat caagcgcctg cgcaatcccg tcactttcga gcgctgccag 22620 

cggctgatcg aggaggtcca gctctccttc cgcctccacc acccggccat cgcccaggtc 22 680 

catcacctga aaatccatgc cgaccggccg cacgtcatcg ccgagtacgt ggacggcccc 22740 

acgctggaca ccatcatcag cctcgccacc atgcgcgaga agccgctctc cgcgcccttc 22800 

gccctctaca tcgccgccga ggtggccgac gccctccacc acgcgcacac gctgagagat 22860 

tcggagaacc ggccgctggg catcatccac cgcgacgtgg cgccccggaa catccgcgtg 22 920 

gcccgcagcg gcgaggtgaa ggtgacggac ttcggcgcta cctactcgct catggtgggc 22980 

agggaggaga cgccgggcct cctgctcaag ggcgacgtgg cgtacgcctc gcccgagtac 23040 

ctgaaccgta agcccatgga tggccggtcc gacatcttct cgctgggcct cgtcctcatg 23100 

gagatgctga cgtgcaagca cctcttcgac gtggaggacg aaaaggcccc caacgccacc 23160 

gtggacgtga agacggagga gacgccctcg gtgcccctca cgcagatgat cgcgctcgtc 23220 

aaccgctacc gccccgagga cgtggagaac gcgatggcgg gcctgccgga cgcgctcaag 23280 

gccatcgtcc acaaggccct ccagcgaaag ctctccgagc gctacgccac ggccgccgag 23340 

atgcgcgatg cgctgcgagc ggcgctcgcg gcggagtcac agcccttcgg ccggaaggag 23400 

gcgagcgagg agctggcgcg gatgctgtcg gaggcgtccg tcctgcgcga ccgggtggaa 234 60 

ctggacgaag aaggcatctt ccccgagggc ctggacgccg acgagccgac gcccgcaccg 23520 

aacgaagagt gagaacgggc ggcggtgcat tccttgaagc aagcgggccc cggtgtgggc 23580 

ccgcgtcgtt tcagcgcaac aacacctggg ccaccttcac gagggcatcg agctggtcct 23640 

cgtccatctt gcgcgccagt ccggtgagct ggcgcagctt gggcgccccg ccctgccctc 23700 

gctccccctt gcccgacttc gtcccctcct ccgcgtccgc gatccccagc aactcgtccg 23760 

aggagatgcg cagcaccgag cacatccgca gcagcgtctg gacgctgggc agcatcttcc 23820 

cgcgctccag gcggctgtag accatgtgcg cgaggcccag cttctcggcc acctccgcct 238 80 

gcgtgagccc gagctgcgtc cgggcctcac gggcggcact tccaatacgg gtcgccagct 23940 

cttcattcat gcgtcggggt accaggacac cgagaaccag gtttggcgcg ggcaggaagg 24000 

cccaagcctc ggggacgccc cttcctgccg catctcggcg gccatgtcga tccacgagca 24 060 
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cgcccaccct agcggccgtc gccctccccg cgacgatctc cgaggagaag gcttccgtga - 25980 

agatgaagaa gaacaccggc gtattctccg agcccgagcc gcagcgcttc cggggcggaa 26040 

ccgttggcaa ggcgctcggc ctcggtgtcg cgggctgcct agcgatggcc tgccctggcc 26100 

cccaggtccg cccgacgcct ccgccagagg cgtgcccgcc aggtgctgtc gaggccatga 26160 

gcaggcttcg aattgagtat gacgaggatg tggtagccac cttcttcgcg accgccgagg 26220 

agggggttag caggaacatc acggtgcgcg cgggcccgac aacggttcac ctggggagac 2 6280 * 

cattgggaaa tctaccggcc cggaccacgc tctccggacg cctcatcatc ggagaggatc 2 6340 

gcgtttacgg ccgactaact gaagcacgca cgccaaaggg tgaccgcttc cctgtatgca 264 00 

tgcagatcat tgagaacgac tctattgggt tcaagaagga gatcaacgfac ggctccaaca 264 60 

gcgcctcggt ctatccctat tttgacgtga aggccgtccg ccgcttcgag tgaaccccga 26520 

ccaggagcaa catggggctg aaccaagtat caatgcaggg ttccactctg ctacttcaag 26580 

gtctccgcgc atgcccatgt cacccatcgt tgttctcctg gtgatagcgc ttttctccgg 26640 

ggcagccgcc gcgcaatcgc gtccagcagc cacgggcrttg ggggtacgcc ggattgagtt 267 00 

ctcggccgag aacttcgagg caatgacgac accggaggta cagataagcc cgggggtttc 267 60 

caccacgttc gagttcaact ccgccctcct tcaggagaag gtcgcggttg aaggcgccga 26820 

ccgcttctcg ctcgtggaca ttggacgaag cactctccgg ctggtgccgt cggagcaagt 26880 

cctgcccggc gaacgcctgc gagtgacggt gcggttcctg gacggagcag cgccggtagg 26940 

catggcattc atcctcgtcg cgcaccccgc tcaggcggag cgcttggtcg aggtgtggcg 27000 

caaccagcgc acggtggagt cctatcaaca ggaatcgaaa gaagcccgag cggaggccca 27060 

aaggtgtcac gaagagaacg agcgcctgcg cgccgagtat gcgggaccgg gcggcctcgc 27120 

tggcctcctt gcgaaccgcg tgatcggcaa gtcgggcgtt tcggtcaagc ccctcgactt 27180 

cgagaaggaa gtccgccagc gtcctggaga cgcgatcagg attcttcgtg catggag.cta 27240 

ccgctccgcc aaccgcgtgt ccgtgctcat ggatttggac tacccagaag ccgcgcaacg 27300 

ctggatcgcg cagggagcat cgttggtgag caagacaggt gaaacgctga gcatgctccc 27360 

tgtatggcag gaagcgcccg ttgccaatgc ccggatccgg cgcctcgtgg tggaagcaga 27420 ' 

ggctgagccg gacgcggccc aggacacgtt caccctcaaa ctgtgggaat cgaacgggct 27480 

gcgcacgatc accctatccg gggtgacatt cccataatgt tgagaacatc ctcactatca 27540 

agctagcacc cacatagcat gaagtccgcg cccgtgcgtg tcatgggccg ttcaaacacc 27600 

tgaaaaccaa taactacatc cttacaccat ccaaaccaag ccccatgtct acagccgagc 27660 

aaacgaagaa aataatcaag aagctgcgag ccaccctaaa cgaaggaagc tcagaaaaga 27720 

ttcaagcact catccagtcc atcagactgg agaatecatc tcagtggctg aatttgatcg 27780 

ccctcgcact gggccccata gatcctagga atccaacatt cttcgaaaaa gtatccgcaa 27840 
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taaacagatt ggcagaagat cttgcgccag aagagcagca cacgctacgc ggatacgaaa 27900 
gcatcgcaag ggccatgcag atcgtatcgc aagagtccga caaatcagaa ttctggaaat 27960 
cttcgcgcct cacaatgatg tggcgcctat ttacgtacgt tgaatcccaa tacatatttg 28020 
ttagcaatac gattcgaaag aagctcaagc gggccccacc gggctcgcca tttgtcatgg 28080 
cgagcccttc aatcgcggtt ccaggaaccg" atgggaccgc aacgacaagt gtcgatcttg 28140 
tttttgaatc taccgccgaa gccgccgaac taatactccg catctccatg cacaggatcg 28200 
acacccaacc cccaaatgaa aagtttaccc cccagacccc ttatgacgat cctgactttg 28260 
gcaggctcct cgcttgcgca cacgcgtggc atcgattcag cctgctatgg aaccaaatcc 28320 
agtataccga ctggcgacct gagcatgatc cacgcggctt catctggaca ccaaaaaaca 28380 
aggcgcaata cctccaaagc gaaatbggaa acattcgcga gcgcctattt ttgcagcaag 2 844 0 
caatgctgtc tgatggactc ggtcctgggg cagaactgga gagtagaaga gaagtcctgg 28500 
aacgcctcaa gaggagcttc aatctcccga agccagggaa aacatgggac cttaagattg 2 8560 
atattaaagc cctgcgagat ctcctcggtc ttgatcgata tgccacggct cgcaagatct 2 8 620 
acatgtcgcg tcgattccta accccagtaa tgggagcgcc agcagatcct gaactggaga 28680 
agtcacagaa ggagttgaag ttgaacttca cgctgcatga actcgccatg gctctgctgc 2 8740 
aaaggaatca cgcaacattc aagaccaagt cagcaataca caacattgtt tttgcagtca 2 8800 
ccaagcagcg cctatgcaag gtaatcagcg aggcgtcggg catcgaattc gaattctgct 28 860 
tttcccatat caacaacatc gtcttcgacg cacagagaaa aaacctagag atctgggacc 28920 
agccgctcgt accagtagat gaccataggg tgttgttcgt tccttcgatc attgccaatt 28980 
cccatcctat tcgcacaata gagcatttag cttcagctcg ctcaagctcc gcgtt.tgact 29040 
cccggggaga gtattatgag cagatgattc aatcgaggct tgaggaatta acacaagcag 29100 
tcgctgtgcg gggcatcaaa tttcctgctt cagatgggcg gcagatcgaa tacgacttgg 29160 
tgctttattg gcaagggcac ctatttatct tcgagcttaa gtgcctgaag atgacaacaa 2922 0 
ctcctgtgga tgagttcggg gcgagggagg agatcgagcg cgccgagcac caattggtac 29280 
ggcgtgtttc tattgccgaa actgactgga aggagttcag gagccaagca cagggagttt 29340 
cactccccga gactccgcca gcgcgcagaa acatccatgc cataatactg accaacatca 29400 
tgaactttac gggccgaaga actggagaga tcgtgacggc agacgactcc tgcctgttta 294 60 
gatacttcga cagccctcat gttcccgtat ttgatgctgc cacgggtgcc gaaatctcaa 29520 
gcattgcacg tttgcgcctt cgcaacgagg ggccgccatc tgcttcgggg ctttggcaat 29580 
atttatcaag ccctccgcag ttggagtgga tgcggaagca aattcggcct gaataccacc 29640 
cactgccacc gctggatgag ggcaactatc actggaagct catggtcgca ttcgatccgg 29700 
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ccgacgccca _ gacgactaaa tagtgttggt ttggtctcgt tgcgaaggtg agcattgacc- 29760 

tcggctggac gctggattca gcgtctacaa caacgatatt gcagggtgag gcggaggctg 29820 

cgtagccttc gtttagaacc cgtggagaac ccgacccatg acgctatacg aactgtttga 29880 

agccgatgat gaccgcgatg tccccgccga ctttccttgg ctcttgatcg agatccctga 29940 

ggagcaactc cgccatgcgg cgcttctcct gaatgagggt gagtggcgac cctcgcacat 30000 

ttctggcatc tggtatcggg tggatcccga gcgcccagct cagaagcagc agcggcacgt 30060 

ccacgtcgcc gcgaagaagc acatcaagat ccccacgaag caggcttcat ggaacagaga 30120 

caccacccgc catgaccgca agacattcaa tgcgaagctg ggctcgcaag ggagctatca 30180 

agacgtggcg aagacggcgc tgggcctgcc gcccgaggct gtcctcgaac acgttgtgga 30240 

aaatccggcc gaacaacaga tgctgctcac cgaatccact gatccccagt tgaaaactga 30300 

gttctacagg tggttggagg cccagcccag gcggtctaac ttcgaagcgc tcgtcgagga 30360 

cgcggttagg ctcaatctgc cgctcgacct ggaatcgtaa ggcagtggtt aaatgcggtg 30420 

atacgagcgg tgatacgagc gcctaacaaa actggcatag ggacccggct tctcaaggac 304 80 

gcagctgcaa ccaaggcgat tttgtaggca ttctttgggg cccgagacag cgcgcgggat 30540 

ctccggcacc cagttcacgg acgtcaccgt ccccggtgca gccaatggcc cctgacccct 30600 

gccgtcccca ccctcgtacc caagctgtac ccaagatgaa cggacgcggg tggacctcca 30660 

tggacgctcc acccaccccg ctccagaggg aaaccggccg accctcaatc cctccgggca 30720 

cctcgcggat cgggggagcg gggcttcaaa accggtgagg ggcgctgaga ggcgtccctg 30780. 

gtgagttcga ttctcatggg gcgacgtgaa cccggccgtg ctccatgcgc tccacaacgc 3084 0 

ggcggaagat gaggtcgata atggcgaggg actgagcctt caggagtggc cggaacagac 30900 

cagggccacg tcagaagcga acgacctccc tttcgtaacc gaataacgaa acagaggcga 30960 

ggatcacaac tttcgaaatc cg'ttgacgcc cgtgggcttc atttcaggaa tcctgggaaa 31020 

tgcctctcct tgctcttctt gggcttctcc atggtagcgc ttcgcgcacc caggctctgg 31080 

tactatccat catatggagc gctccctcgg aacgacagag caggtcttct ataaggtacg 31140 

gcagaagcgc cccttcaaca tcgtcattac gggcaagctg cgaggacgcg tggaggagca 31200 

ggctgtgcgc caggggttgg tggccctgca acggcgacac ccgctgctcc gagcgaagat 31260 

cgtcgcgggt actccgccac gcttcacctc gcaaggtgtg ccccccattg cgctggaagt 31320 

ggtggaacgc aaggcagagg agtcctggca acagcatgtc gaggcagagc ttgacaggcc 31380 

tttcaactcg gaccctgggc cgctcgtccg cttcatcctc gtgcggggcg agcaccgctc 3144 0 

cgagctgctg tgcagctatg atcatctgat cggagacgcg cactccggca tcttcgccct 31500 

gcgcgatctg ctgcaggtca tggcctccca ggaccagcac ctgcccgagc tcgccccaag 31560 

gcccgcctat gaggagctga ttgggccgat ggtaccgggc acccgactgc ttggcgccgc 31620 
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gacgcccgga caccaccggc cccgcgccca cggcgacgga ggtggccgtg cagaggatgt _ 33540 

ctgcctcctg ctccacgcgc gtcaggggga ccgccaccac ctccaggccc aggaaggcca 33600 

cacgccgggc aaagcttcgc atggcttcgg gagcaatgtc gtgcaccagc acccgtccca 33660 

gaggaaagac gcgcgagagc gcatg;tgcct gggtgacggc ctgagcgcca caccctacca 33720 

ggcccaatac ccggctgtcc tcccgcgcga gcagccgact cgccacggcg gaggccgccc 3378 0 

cggtgcgtag cgcggtagga aaggtgccat cacaaacggc ccgcaggtgc ccggtcgtca 33840 - 

catcatacag acrtgagggag gaaagaatgg tgggcaagcc cagctcctcc gggctgcggg 33900 

ggttgtagcc caccagcttg atcacggcgt ggcgccccac ctgcatgacg ggcatccact 33960 

ccaacacgcc ggggtggggg tgctgatact ggaagccctc gcgcttgcgc agctcggtgt 34020 

tggcggggtc gaagtgctcc agctcgtact cgagggtgga gatgacctca tccatcagcg 34080 

cgtgcagccc cgtt'gcacgg acgatctggc gcagttcctg ctcacccagg atccttgtca 34140 

tccgcatggc tgaccccgcc cctttcagct gcatgacagg cctcactgca ttcacggctc 34200 

cagttcaggg ccgggcaaaa tctatcttca acatcccctt gtccaggacc gcgtccacgg 34260 

catccagctg cgccaccgag cgcggcagca tgacgtggcg gcggaagccg cccacgcgga 34320 

tgatgaggtc attgccctgg cgatccagga caatgtctcc gcggtcggca cctggcatga 34380 

ggagctgcag ccgatagcgg ccctcgtgct gcttggcgaa ctgatagggc tgcccggaga 3444 0 

tgtagcgctc ggtggggtcc gagtccccgt agagccgctg cgccagatcc tccaaccgct 34500 

ccagccccac cacctcgtgc tccagcagcg ggagcctggc caccggcatg ggggagaagt 34560 

actcctggat gtgatccagg taggcagatt gagacttgtg ccactgagca aagtattccg 34620 

tgtccggcag cagacgattg accacgacct ggtccaccgt catgccatac atgttgaagt 34680 

agaggtaggc ccgctgtgtc tcgcggatga ccattttttc cgcgctggag accaatcgca 34740 

ccgtggtgcg attgccatcc gtgagcaacc cttcaatgcc cttgacgcga tcgaagagct 34 800 

gctcgaggga ggcaaagtag ctgtcctccg gcagatcata gctcgtgagc cgactggcca 34860 

ggggccgggc cagcttgacg agcgtgcgat ccacattgaa gcgccggcgg atataccact 34920 

gcagcacgct ggtgatgttg acgaagcgca gcgactcgcc cgtgggcgga cagtccacga 34980 

tgatcacgtc atagcgcccc tgctgcacgt actggttcag gtagatgagc gagatgacgt 35040 

cctccgtgcc cgggagaatg gcgacctcct cggccaccat gttggatacc ccggtggagg 35100 

tcagcagcac ggacatgtag ttatagactt cactccactg ccgctggagt tcgtgctgga 35160 

tgtcgatctc ttgcagttca aggttggggg cgaccttctg gggcagtccc tcgttgaagt 35220 

cgaagagctt gcgatcgaga tcgaagctgt ccgagaggct gtgggcaatg tcgaaggaca 35280 

tcaccaaggt gcggtagccg cgcttggcag cggccaccgc ggtggccgcg gatgccgtcg 35340 

tcttgcctac cccacccttg ccagagaaaa gaagaattct tgtcatggat gccccgcgtg 35400 
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tcgatggatt 


35580 


ggctatcggg 


cacagccccc 


ccccttgttc 


aattccagga 


ggggtgcaat 


tgacagccac 


35640 


agcgactgcc 


gagcacgcgc 


tgaaagccct 


ccgggccaag 


ggactcgcca 


cgtcggacga 


35700 


ggcgctgccc 


gcggtgcggc 


acgccagcgg 


cgaaaaggct 


cccctctcat 


cctcacagcg 


35760 


gcgcatgtgg 


ttcctggagc 


agctcgagcc 


aggcaacgcg 


gcccagcatt 


tgttgcaaag 


35820 


tcatcacata 


caggggcctt 


tgcaggtaga 


ggggttgcgg 


cgggcgttgg 


ggctcatggt 


35880 


caagcgccat 


gaggcgctcc 


ggctggtggt 


tgccattggc 


gcggcgggcc 


ctgagcagcg 


35940 


tgtgcggccc 


gagtggtggc 


ccgagctgcc 


tctcagcgat 


ctgagcgggg 


tcgcccaggc 


3 6000 


ggacagggct 


cgggccctgg 


cggagctggc 


gcgcgtggag 


gctgcggcgc 


ccttcaacct 


36060 


gcagcaaggc 


ccactgttcc 


gagtccggct 


ggcgcgactg 


gcggaaacgg 


agcatgtgct 


36120 


gctggtcacc 


ctgcatcacc 


tgatctcgga 


tggagcctgg 


agctgcgagg 


tgctcatcaa 


36180 


agagctggcg 


atgctctacg 


gccagcacgt 


ggaaggctcg 


agcccggagc 


tggcgccact 


36240 


gcccgtccaa 


tacagggact 


acgcrtggctg 


ggaggcaagc 


ttcgcgcccg 


cgggagaggc 


36300 


cttggaggcc 


tggtggcggc 


agcggctcgc 


cggggtgccc 


acggtgctgg 


agctgcccac 


36360 


ggagggagcg 


cgtcccctca 


gacagacgta 


ccgggcaggg 


cgggtggcca 


tcaccgtgca 


36420 


gccgcgcctg 


cgccaggcgc 


tggaggacct 


ggcgcacaag 


gagggcgtgt 


cactctttgc 


36480 


cctgctgctc 


accgccttca 


ccacgctgct 


acaccgctac 


tctcgccagg 


aggaattggt 


36540 


ggtggggtgg 


cccgccccgc 


agcgcccccg 


gcccgagctg 


catggcctca 


ttggatactt 


36600 


cggcaccccg 


gtggcattgc 


gctcgcggct 


ggagcctcac 


acccgggtgc 


gggaggcgct 


36660 


gcggcagctc 


gatcaggagg 


tgcgtgaggc 


caacgcccat 


gcggcgctcc 


ccttcgagcg 


36720 


gctggtgagc 


ctgctagaca 


ttgcccgcag 


ccccagccgc 


cacccgctgt 


tccaggtgct 


36780 


gttcgacctg 


ctgccggagc 


agccccagcc 


taccgctggc 


ggctgcgcct 


tccggccctg 


36840 


ggagtccttc 


accggcctgg 


tggcgtatga 


tctcactctg 


ctgctggagc 


cgcgcggtga 


36900 


ggggctggag 


ggggcgctgg 


actacagcgc 


ggacctgttc 


agcgaggcgc 


gcatgcagcg 


36960 


cgccgccact 


cagtacctgc 


acctgctgga 


gcagctcgtg 


gagcggcctc 


acgagaggct 


37 02 0 


ctcgcggctg 


gcgctcctca 


cgcctggtga 


gcacgaggct 


ttgctggcgg 


ggcacggcct 


37080 


gggcgggccc 


gtggagggcg 


cgcaggtgct 


ggcccaccac 


cgcttcgagc 


accaggtgcg 


37140 


gctcaccccc 


catcaccccg 


cgttgtgctt 


cggcccgcag 


gtgctctcct 


acgagcagct 


37200 


caaccgccgc 


gccaacccgc 


tcgcccaccg 


gctgcggcgc 


ctgggcgcgg 


gcccggacac 


37260 
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cctggtaggg ctgtgcgtgg agcgctccct ggagctgccg gtggcactgc tggccatatg - 37320 

gaaggccggg gccggcttcc ttccgctgga cgtcaatcag ccccgcgagc ggctcgcctt 37380 

cctcctggga gatgcgagct gccgcatcct cctcacccag gagcacctgc tccagcgcct 37440 

gccccccacg aacgccgcgc tcctgtgtct ggagagggag gcggaggcac tggagcgcga 37500 

gccccaggag gatgcgccac acgaggccgg gctcgacaac ctggcctacg tcatccacac 37560 

ctctggctcc acgggcacgc ccaagggcat cgcgatggtg catcgctgtc tggccaacct 37620 

ggtggcctgg cagctcaccc atgagcggct gggtggcccc tcacgcacgc tccagttcgc 37680 

ctcgctcaac ttcgacatct gctaccagga actcttcacc acctgggccg ctgggggcac 37740 

cgtggtcatg gtgacggaag aggtgcgcag ggatcctgcc cggctgctgg aagt.gctgga 37800 

gcaggagcag gtgagccggc tgtacctgcc cttcatcgcc ctgcagcagc tcgcgcgggt 37860 

ggcggatgag cgcggcgcgg cccctcgcca cctgcgccag ctcattaccg ccggggagca 37920 

actccaggcg acccccgagt tgcagcggct gctctcgcgg atgccggagt gcaccctcca 37980 

caaccagtac ggcccctccg agtgccacgt ggtgacgagc catgacctga cacgcgagcc 38040 

gagccgttgg ccacggctgc cgcccgtagg ccggccactg gcccacctcc gggtgctgtt 38100 

gctggacggg gagcagcagc tcgtgcctcc gggtgtggcc ggagaggtgt tcctgggcgg 38160. 

ccccgccctg gcgcgcggct acctgggacg tccggagcag acggctgatc gcttcgtgcc 38220 

cgatccattc tcccgcgagc ctggagcccg gctctaccgc accggggacc tggcgcgcct 38280 

ccgagaggac ggagcgctgg agttcctgca acggatggac gcgcaggtga agatccgggg 3834 0 

ctaccgcatc gagcctgggg agatcgaggt ggtgctgtgc gagcaccccg ccgtgcacca 38400 

agcgcacgtg cggccctacg tggacagcgc cggagagcgg cgcctggtgg cctacgtggc 384 60 

cgcacggctc gaggacacgg acggggcgga gacagagcac gtggagcgct ggcgcgcggt 38520 

gtgggatgag acctatggcg gcccaagcgg cacggccttt gacctggccg ggtggaatga 38580 

cagcgtgcgc ggcgagccgc tgcctccgga gcagatgcga gagtgggtgg agacgacagt 38640 

ggagcggctc atggagctcg ttccccggcg ggtgctggag ctgggctgtg gctccgggct 38700 

cctgctccgc cggctcgccc cccgctgcga gtcctactgg ggcacggagc tctccccggt 387 60 

agccgtcgag cggctgaggg agcaactcca gacgggcggc tccccgctcg cgcagcgcgt 38820 

gcggctcatg gcccagccgg cggatgactt ctccgggctt ccggaagccg gcttcgacac 38880 

cgtcatcctc aactcggtga cgcagctctt ccccagcgtg gactacctgc tgcgggtcgt 38940 

ggagggcgcg ctgcgcgtgc tccaaccggg cggaaccctg ttcattggcg acgtgcagaa 39000 

tctgcggctc ttcgagctgt tccatgcctc ggtggccctg gagcaggcgt cagcggacct 39060 

ggaggcgcca gcgctgctcg cccgcacccg ccagcgcatg ctgctggacg aacggttgta 3912 0 

cgtggacccg gacttcttcg ccgcgctcgc cacgcacttt ccccagctgg gcgcggtccg 39180 
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gctgcacctc aagcgcggga gcgggaggaa cgagatgaac cgcttccgct acgacgtgga 3S240 
gctgcagctc gcccccgtag cgaaagcagg ccccgcgcaa gagctgccag agctggactg 39300 
gaggcatgag gggctcggcc tggaaaggct ggagcgcatg ctggcggagc gaccggcggg 39360 
gctggtgctg cgcaatgtgg ccaacgcccg cacggcggac gaggcggcac ggctggcgct 39420 
gctgcggact ggcaacagcg tgggccggct gcgggcactg ccggcggtga catcctggaa 39480 
tccagagcag ctctggaggc tggcggaggc agccgactac acgtgccacg tcacctggag 39540 
cgcccaggac gaggaaggcc gtttcgacgc gctgctcatg gcccgcgcgg ctggctcctc 39600 
gcgcccggcg gcctggctga cgcctccccc gcctccccct cgaccctgga agagctacgc 39660 
caaccagccc ctggcggcca gccgccggcg caccctcgtg ggagtgctgc gaagccacct 39720 
cgagcacaag ctgcccgagt acatggtgcc ctcttccttc gtgctgctgg acgcgctgcc 39780 
gctcaagccc accggcaagt tggaggtggc ggcactgcct ccccccgagc ccgcacaagc 3984 0 
cgagcaaacg ccaggccacc tcgcgccgcg gacccccacc gagcgccggc ttgccgagct 39900 
gtggcggcgc gtgctcggcg tgcatcgcgt gggggtggag gacaacttct tccagctggg 39960 
gggccactcg cttctggcca cacggctctt gtcgctcatc cgcggagagc tggggctgga 4 0020 
gctgcccctg cgggtgctct tcgagcagcc caccctggcg gccatggcgg gttgtctcga 40080 
ggctcagagc tggagcaccc aggctcccca ccctccctct gcctccatcg aggagggaga 40140 , 
actttgagcg ccggagcgtt gctcgcccac gccgcgagcc tgggtgtacg cctgtgggta 4 0200 
gagggcgagc gactgcgctt ccaggctccc ccaggggtga tgacgcccga gctgcagtcc 4 0260 
cgcctgggag gcgctcgcca tgagctcatc gcactgctac ggcagctcca gccctcctct 40320 
cagggaggca gcctcctggc cccagtggct cgaaacgggo ggctggcgct ctccttcgcc 4038 0 
cagcagcggc tgtggttcca ggagcagctc caccctgagg ccccggccaa caacctcacg 40440 
ggggccgtgg tgttcaccgg cccgctgcac gtggccgcgc tgctcggggc ggtggctgcg 40500 
ctggtgaggc gacacgaagc gctgcgcacc accctgggcg aggagggcgg agtcccctat 40560 
tcgctcatcg gcgagccgtg gcagccggcg ctggaggtgg aagcgctacc gggtgccacc 4 0620 
gtgggcgagc ggctggagca ggcccgagag gtggccctgg ccgagtcccg gcgccgcttc 40680 
gccctggaga cggagcccca cctgcgcgtg cgcctgctgc gcctggccga gcagcagcac 40740 
gtgctggtgc tcagcctcca ccacatcgcg gcggatggag tcgggctgca ggtgctcgaa 40800 
caggagctgg cggcgctcta cggcgcgctg agcgctgggg ccgagccgcg gctacctccc 40860 
ctgcccctgc aggtggcgga ccttgccgac tggcagcgcc ggtgggtgga gggagaggag 40920 
taccaggtcc agctcgctta ctggcggcga cagctcgccg ggctcacgcc cctggaggta 40980 
ccaggagatc atcctcgccc gcgtatcccc tccatgagag gcgcggaggt acg ggcgccc 4 1040 
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ctgctctccg ctccgcaag.c ccaggtgctg cgcgcgctgg ggcaaggcga gggcgccacc 41100 
ctctacatga cgctcctggc cgccctgggc gtgctgctgc aacggtggac gggccagcac 41160 
gatatggcgg tgggcagcgc cgccgccaac cgcaaccgcc cgggcttgga gggcatcctc 41220 
ggcttcctcc tcaacatcgt cctgctgcgg ctcgacttga gaggccgccc ccgcttccgc 41280 
gagttgctgc gtcaggcacg cagggtgtgt gtggaggcct atgcccatca ggagttgccc 41340 
ttcgagcacc tggtggaggc gctccagcca ggcagcgagc gcggggacag ctcgctctat 41400 : 
cgcgtggcgc tcgcggtgag cgacacgcca tggatgcccg gccacgggct gaagctggag 41460 
ggggtgcaag cgcagccgct cgactttccc cggggggtgc tggacctgga tctccacctg 41520 
tgggtgtatg acaccgggga ggggctcacc gggcggttgg agtacgccgt ggatctgtat 41580 
gaggagccca cggcaaggcg gctcctggag ggcttccgcc aggtgctgga ggcggtggtg 41640 
gaggcgccgg atcggcccgt gccggagctg ccggtgctgg gagagcagga gcgccaccag 41700 
gtgctctccg ggtggaaccg cacacagcgc ccctatccgc gagaggccag cgttcacggc 41760 
ctctttcagc agcgtgccct ccaggccccg cgggccgtgg cagtggtgta tggcgagcgc 41820 
agcctcacct acggcgagtt ggcggagcgg gcccgcgggc tcgcacaggg tctggtggcc 41880 : 
cgaggcgtgc ggcgaggaga cctggtcgcc cttcggctgg agcgctcgcc ggagcaggtg 41940 
gagtccatgc tggccgtact ccaagccggg gccgcctacg tgccgctgga tccttcctac 42000 
cccgtacagc gccaggagtt catgctccag gacagcggcg cgcggttgct cgtgcacagc 42060 
ggcccgctgc ccttcgctcc ccagggctgc gccacgctgg atctccaggc atggcacccc 42120 
gctccctccg acggtggcga gcccctgccc cagtgcagcg gagaagatct ggcgtatgtc 42180 
atctatacgt ccggctccac cggccagccc aagggcgtgg ccgtgtgcca ccgggccatg 42240 
acccgcctgg tgtgcaacac ggactacgtt cagctcgggc cagaggatcg ggtcgcccag 42300 
gcttccaatg cctcctttga cgcggccacc ttcgaggtct ggggcgcgct gctcaatggg 42360 ' 
gcacggctgg tggggctcgc cacggaggag gccattcagg cgcgccggct ggccgaggtc 42420 
ctgcgcgagc agcggatctc cgtgctcttc gtcaccaccg ccctcttcaa ccacgtggcc 42480 
cgggagcaac cccaggcctt cagcaccctg cgctacctgc tctttggcgg cgaggcagtg 4254 0 
gatgcctcca gtgtgaggcg ggtgctgaaa cagggcgctc caggacacct tctacacgtg 42600 
tacggcccca cggagaacac caccttctcc accgcctggc gggtggaaca cctggccgag 42660 
caggcgcata ccgtgcccat gggtcatccc atcgccaact cgcggctgca cgtgctggac 42720 
gaagcgctgc agccggtgcc ggtgggcgcc atgggcgagg tatacctggg aggtgatggg 42780 
ctggcgctgg gctactggcg ccaccccgag gccaccgcgg agcgcttcgt gccggatccg 42840 
cacggcctgg agcccggagg ccggctctac cgcacgggag atctggcgcg gcggcaggcg 42900 
gatggggccg tggtgttcgc tggccgcgtg gacaggcagg tcaagctgcg aggcttccgc 42960 
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gtggagccgg cggagatcga gtcgcacctg tgcgagcact cggaggtgtc cgcggcggtg 43020 

gtggagctgc ggggcgaagg ggccctgcgg cggctggtcg cctatgtcgt cccccgcgcc 43080 

ggtggccgcc caggtgccga ggagctgcgc accttcctcc gcacccgact gcccgagtac 43140 

atgctgcccg ccagcttctc cctgctggag gcactgcccc tcacccccaa cggcaaggtg 43200 

gatcgctcgg cgctacccga gagcttcgag gaggcctccc gcgagcaggc tccggtggta 4 3260 

cctccacgag gccccgtgga ggcgctigctg gtggacatct ggagggaggt gctcggcacc 4 3320 

caacgggtat ccgtgcacga cgacttcttc gacctgggcg gacactccct gctggccacg 4 3380 

cgggttgtct cccgcttgcg agaggcgctg caggtggagt tgccgctgcg caccctcttc 434 40 

gaggcccctc agctctcggc gctggcggcc caggtggagg tcctgctcgg ccaccggcag 43500 

ctccgccccc ctccgctcgt gcccgctgta cgtccaccag agctgcccct ctccttcgcc 43560 

cagcagcggc tgtggttcct ccagcagctc gcgccacaaa gcaccgccta ccagatcctg 43620 

gatgcgtggc atgtgcgggg ccgggtggac gtgggcgccc tggagcgcgc cctggagcag 43680 

ctcgtgcgcc ggcatgaggc gctgcgcacc actttcgagc ctggcggcga cggcgtgcct 4374 0 

cggcagcgca tccacgcgcc ggctccggtc ccgctgcggc aggtggacct gcgctcccat 43800 

ggcatcgccg cgcggga'gga ggccttgcgg tggatgcgcg agcaggcgct ccggccactg 438 60 

gagctggaca aggggccgct gctgcgcgtg tccctgctgc gcttggaaga ggcacagtcc 43920 

ctgctcttcc tcgagctgca ccatatcgtg ggcgatggct ggtcgctgag cgtttggagc 43980 

cgagagctgt cgcacctgta cgaggcggcg ctccatggcg ctgagccggg gttggcgccg 44040 

ctgcccgtgc agtacgcgga cttcgcgctg tggcagcgcg gctggttgca agggccggtg 44100 

ctgcgggagg agctgacctg gtggcgggag cggctcgcgc gcctggcccc gctgcgcctg 44160 

cccgcggacc atgcccgccc ggaagtgcag cgcttcaacg gcgcgacgta ccgcttcacg 44220 

ctcccgggcg tacgggtgca ggcgctgcgg cggctcgggc atgagcacgg ggccacactc 44280 

ttcatggtgt tgctcgccgg cttcaatgcg ctgctggcgc gctacaccgg gcagacggac 44340 

atcgccattg gcgcgcccat cgccaaccgc acacgtgggg aggtggaggg cctcatcggc 444 00 

ttcttcgtca acaccctggt gctgcgcacc cgcctggaag gcaacccctc cttcctcgag 4 44 60 

ctgttgaggc gggtgaggga gacaacgcta gaggcctacg cccaccagga gctgcctttc 4 4520 

gagaggctcg tcgaggagtt gcagcccgag cgccaggcca accagaaccc gctggtgcag 4 4580 

gtgctgctcg ccctgcagaa cgcgccccgc gagccgttgc ggctggcggg cctggaggcc 44640 

gagcacctgg agtacctggt ggccaccacg cgcttcgacc tcgagctgca cctgtgggag 44700 

gaggaagagg ggctgagctg catcgccgtg tatgaccgcg cgctgtacgg cgcggggacg 44760 

gtggagcggc tggtgggcgc ctggtgcacg ctgctggagg gcgtggccga gctcccggcg 44820 
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cgccgcgtgg cggagctgcc . cctggtgcct gcccgggagc tgcgacaggt tccgccgccc - 44880 

tcccccgccg cggcgatcga aacaagcatc ggcgcccgct tctcggaggt ggcgcggcgg 44940 

cagccaggcg ccacggccgt cacccaaggc gggcggcacc tcacctatgc agagctggag 45000 

gagcgctcgg aacgcctg'gc ccgctacctg gcctggctgg gcgtgcgcgc gggcgacaga 45060 

gtggggttgg ccaccgagcg cacgctggag cggatcatca gcctgctagg catcctcaag 45120 

gcgggagccg cctacgtacc gctggatgtg cgccagccag cgcgtcggct gagcctgctg 45180 

gtgcaggccg cgggcgtgcg caccgtcatc gccgaggagc aggctcgcac ggtgctgtca 4524 0 

ggcctggggc agccactgac cctggtcgat gccgcccagg agccggcctc cgcgcagcag 45300 

gtccccgcgc tcgggccgga gcgctcgctg ggcggggaca tgctcgccta cgtgcttttc 45360 

acctcgggct ccaccggcga gcccaagggc gtctgcattc cccaccgtgc cgtgctgcgg 45420 

ctgatccatg agccctccta cgtccagctc tcgccgcggg aggtcatgct gcactacgca 45480 

ccgctggagt tcgatgcctc caccttcgag gtctgggggg cgctgctcaa cggggcaagg 45540 

ctcgtgctgg tccctccgga acagcagtcg ctcgagagcc tgggacagga gctgagcacc 45600 

cagggcgtca ccgtgctgtg gctcaccgcc gggctcttcc ggctcatggt ggaggagcag 45660 

ctcaagagcc tgcgcggcgt gcgccagctg ctcgccggag gggacgtgct gcccatgccg 45720 

caggtacgcc ggctgcgcga ggccctcccc gagtgccagc tcatcaacgg ctacggcccc 45780 

accgagagct gcaccttcac ctgctgtca'c cgcgtgggca gcccccagga gctgggcggc 45840 

tccgtgccca tcggcacccc catcgacctg ggctgggtga gcgtggtgga cgagcggctc 45900 

cagcccgtgc cggacggagc cccgggcgag ctgctcgtgg gcggccccgg gctggcttgg 45960 

gggtacctgc aacacccgga gctcaccgcc gagcgcttca tccccgatcc gctcagccgg 46020 

acgccggggg ctcgcgtcta tcggacggga gacctggtgc ggcgcaggga ggatgggacg 46080 

ctggagttcc tgggccgcgt ggac'caccag ctcaaggtac gcggcttccg catcgagccg 46140 

ggcgaggtgg aggccgcggt gctcacccac ccggcggtgc agtccgcggt ggtggtgggg 46200 

cgcgagggcc ccggcggcaa ggagctggtc tgctacgccg tgccgcgggt ggagagctcg 46260 

gagcagggct cgcagcagga gcagcggctg gtacacgagt gggagtccgt gttcgacggg 46320 

cacatgtacc gcgaagcccc cgtgggcgga gagccgacct tcaacatcgt cggctggaag 46380 

agcagctaca ccggccaacc cgtggccgtg gaggagatga gggactggct gcgccaccgg 46440 

gtggagcgcg tgcgcgggct caggccacga cggatcctcg aagtgggctg tggtacgggg 46500 

ctgatgctct ttgccctgct gccgcactgc gagcgctacg tgggcacgga tttctccccg 46560 

gcggcgttgg actacgtgcg tcgctacctc cccccggagc acccgggccg cgtggagctg 46620 

ctacaccgca cggcggacga gtggagcggc gtggcggccg gctccttcga cgcggtgctg 46680 

ctcaattcgg tggtgcagta cttcccctcg caggagtacc tgcggcaggt gctggcccgc 46740 
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tgcgtggagg 


ccgtggagga 


cgggggcttc 


gtcttcgtgg 


gggatgtgcg 


gagcttgccg 


46800 


ctgctggagt 


ccttccacgc 


ctcggtggag 


ctggagcggg 


ccgccccctc 


catgccgctg 


46860 


gaggcgtggc 


gcgagcgggt 


gcggcgtgcg 


gtgctggagg 


acaacgagct 


ggtggtggac 


46920 


ccggcactct 


tcgtggcgct 


ggcccatcag 


catccacggg 


tgagccacgt 


ggatatcgag 


46980 


ctgacgcgcg 


gcacgcaccc 


gaatgagatg 


gcacgcttcc 


gctacaacgc 


cgtgctccac 


47040 


atcgggccgc 


gcacgccgcc 


accggcctcc 


gaggtgccgt 


gggtggactg 


gtccacgcaa 


47100 


ggactgagcc 


tcgatgcact 


gcgggcrtcgg 


ctccggcagg 


gcccgccagg 


gccactgggg 


47160 


gtggcaggca 


ttcccaatgc 


gcgagtgctg 


cccgcggtcc 


gggccgccga 


ggcgctgggc 


47220 


agcacaggca 


gcgcgcggcg 


ggtggaggag 


ctgcgccggc 


gcctgtccca 


acccggcaca 


47280 


ggggcccagg 


atccagaccc 


cttctggcaa 


ctggccgagt 


cgctcggcta 


cacggcggca 


47340 


gtgagctggt 


ctcctgggcg 


gagggacggg 


gccttcgacg 


tgctcttcct 


cccggcgacg 


47400 


ccagggatgc 


acccgcggtg 


gctcggcccc 


acgccgctca 


accgcacgcc 


gcccccagcc 


47460 


tccgcgcgtc 


tgtcctcgga 


gcctcggcgg 


gccagcctct 


cactgaggct 


gggctccgcg 


47520 


ctgcgggccc 


acctgcagac 


ccatctacca 


gacttcatgg 


tgccctcacg 


cttcgtggtg 


47580 


ctgcagtccc 


tgccgctcac 


tcccaatggc 


aaggtggacc 


gcgcggcctt 


gcccgtcccc 


47640 


gactcgcgtc 


ggctggaatc 


tgccccgctg 


gtgcccccca 


gcaacgagct 


ggagcgggtg 


47700 


ctggcgcagg 


tgtggaagga 


agtgctggga 


ctggaggaag 


tgagccggga 


ggacaacttc 


47760 


ttcgacgtgg 


gagggcactc 


gctgctgctg 


gcgcaggtgt 


gcagccggct 


ggaggcccga 


47820 


ctgggccggc 


ggctcgaact 


ggtgaccctc 


ttccgctact 


cctccattgc 


tgccctggcc 


47880 


gagcacctgc 


aggcccccca 


ggagctggca 


gccgccgagg 

> * 


cgcaggtgca 


gcgcatggcc 


47940 


acggagcgcg 


ccttgctcca 


gcaacaggca 


gcccaacgcc 


gccgggccgg 


ttcgaagcgg 


48000 


ggagctccca 


atgacaccta 


gtggggatga 


agcgctgcag 


tcttccatcg 


ccctggtagg 


48060 


catggccggc 


cgcttcccgg 


gggccccgga 


cgtggagtcc 


ttcrtggcgca 


atctggtggc 


48120 


cggagtggag 


tccatttcct 


tcttctccga 


ggaagagctg 


agacaggcgg 


gcgtgtccga 


48180 


gcagatacgt 


cggcgccccg 


agtacgtgcc 


cgccaagggt 


gtgctggaag 


acctggagct: 


48240 


gttcgacgcg 


ggcttcttcg 


gctactcgcc 


gcgcgaggcg 


agccacctgg 


atccgcagca 


48300 


acgcctgctg 


ctggagtgct 


cgtgggaggc 


gctggaggat 


gcgggccttc 


gcccggatca 


48360 


gctcccaggc 


tgggtgggcg 


tctacgtggg 


cgccggggac 


accagctacc 


gcttccagct 


48420 


gctgcgcgga 


cacggggacc 


cgctcagcgg 


ctccaaggat 


gtggcgggct 


tctttggcaa 


48480 


ctacccggac 


tttctcgcca 


cgcgcgtggc 


ctacaagctc 


aatctgcgcg 


gccccgcgct 


48540 


cggcatccac 


accgcgtgct 


ccacctcgct 


cgtctccatc 


aacatggcgt 


gcagcgcgct 


48600 
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gcgcggcttc gagtgtgaca tggcgctcgc gggcggcgtc t.cgctgcggc tgcccgcgcg - 48660 

ctccggctac ctctacgagg aggggggagt cgcctcgaag gacgggcact gccgcccctt 4 8720 

cgacgcgcgt gctaccggca ccgtcacggg ggatggcgtg ggcgtggtgg tgctcaagcg 48780 

cctggaggac gcgctgaagg ccagggatcc catccacgcg gtgatccgcg gctgggcgct 4 884 0 

caacaacgac ggcgcctccc gggctggctt caccgcgccc agcgtggagg gccaatccga 48900 

ggtgatcgcc ctggcgcacg ccgcggcggg catcagcgca cgcgacatca cctacgtgga 48960 ' 

ggctcacggc accggcactc ccctgggaga cccgatcgaa gtggcggcgc tcacccgcgc 49020 

cttccgggcg cataccgctg acaccgcctt ctgtaccctc ggtgcggtca aatccaacat 49080 

cggacacctg gatgcggcgg caggagtggc cggggtgatc aagacggtgc aggccctgcg 49140 

ccaccggctc atccctccca cgctccactt cgagcggccc aatcccgcgc tccacctgga 49200 

gcagagcccc ttcttcgtca acacccagcc gctcccgtgg gagagcccgc gcgggcctcg 49260 

gctggcgggg gtgagctcct ttggcattgg cggcaccaac gcccacacgc tcttcgaaga 49320 

ggctccgccg ccgcccgcca gcggccccac ccgtcccaac caggtgctgc tgctctcggc 49380 

ccgaagcacc agcgcgctcg agcacatcgc aggacggctc gcggcacacc tgcgccgcca 4944 0 

cccggacctg gaactggcgg acgtggcctt taccctccag gtggggcgag cccgcttccc 49500 

ctaccggcgc gccctcacct gtcgcaccct ggcdgaggcc atggagcgcc tggaggctcc 49560 

cgagccgcgg ccacccgagc cgcttgctca cgagggagag cggccccctc tcgtcatgct 49620 

ctttccaggg cagggcactc cgctggtcgg cacggcccgt gcgctccatg aatccgagcc 49680 

caccttccgc caggcggtgg agcagtgtgc ccggctcctg aggcagacgc tggggctgga 49740 

tgtcagggag gtgctcttcc cctccgcgga gcaggaggag caggcacgcc ggctggcggc 49800 

gcagacgcgg gtggcccagc ccgcgctctt caccctggag tatgccctgg cgcagacctg 49860 

gctgggctgg gggctccaac cgcaggcgct ggcaggccat agcctgggcg agctggtggc 49920 

ggcgtgcctc gcgggtgtct tctccctgga agatgcactt cagctcgtgg cagcccgggg 4998 0 

acagctcatg cagggatgcc caccgggggc catgctggcc gtgccgctgc cggaggccga 50040 

gctggcggcg ctgctgggca gcgagctgtg tatcgccgcg gtgaacgggc cacgggcctg 50100 

cgtggcctcg ggtcctctac cggcggtaga ggcgctcacc gccgbgctgg agagccgggg 50160 

cgtgtccagc cggcgcctgg agacttccca tgccttccac tctgcctcca tggaggcatg 50220 

ccaggggcca ctcaccacgc tgctgcggcg catgcgcctg caggcccctc gcctcccctg 50280 

tgtctccggc ctcaccggcc ggtggctcac cggcgaggag gccacggagc ctacgtactg 50340 

ggcccgccag ctccgcgagc cggtacgttt ctccgaggcc ctcgagacgc tctggagcct 50400 

caaggagcca gtgctgctgg aggtaggccc cggcaccacg ctcaccgcgc ttgcgcggcg 50460 

gcaccccacc cgccccgccc gcacccagga ggtggcgagc cttcccgtgc aaccggacac 50520 
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ggccgtgccg 


tgcattgaag 


aggccgtggg 
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tgagctgtgg 


caggccggcc 


tggagctgga 


50580 


ctggagcgcc 


ctgcacgccg 


cgccacgcca 


ccgcgcacac 


cttccaccct 


accccttcga 


50640 


gcgccagcgc 


tactggattg 


aaccggaggc 


tgccccgcag 


ccgcgcgcgc 


agcagccgac 


50700 


gcccgcgtcc 


cttgtgcccc 


cggagcagcc 


ctcgcgcgag 


gccctggaag 


actggttcta 


50760 % 


cgtgcccacc 


tgggagcagg 


cacctgccac 


gagcgggggg 


ggacagcccc 


tggcgggccc 


50820 


ggtgctcgcc 


ttcatggact 


cctcgggcct 


ggccgagcag 


gtgctggccg 


cgctgtggcc 


50880 


cgcggactcc 


ggcgcgctcc 


tcacccgcgt 


cgagccggcc 


gggcactatg 


agcaactcag 


50940 


tgagcacgcc 


ttccgcctcc 


gccccgagag 


cgaggaggac 


tgggacgcgc 


tcttccaggc 


51000 


gctccagtcc 


cagggccggc 


tcccccgtcg 


catcctccat 


gcctgggctc 


tcaccgcgga 


51060 


gcccggcccc 


tgtaccccgg 


acggggaagc 


ggtgctggaa 


cagggcttct 


tcagcctgct 


51120 


gcggctggcc 


cgtgcgctcg 


gccgccacgc 


gcctgagcgc 


cctgtacagc 


tcgaggtgct 


51180 


gtccagcttc 


gtccacgcgg 


tgggcccgcg 


ggagccgctc 


gagccgctca 


aggccacgct 


51240 


gctgggggcc 


tgtgcggtac 


ttcccctgga 


gtaccctcac 


gtgcagtgcc 


gcaccattga 


51300 


cgtgcggccc 


gggagcgagc 


cacgggaagt 


gctggtgagg 


agcctggccg 


ccgagctggc 


51360 


cgctcccatg 


ggagagagcc 


cggtggcctg 


gcgcgacggg 


cagcggtacg 


tgcgccgcgc 


51420 


cacccggcag 


aggctcgagg 


cctcgcggcc 


cctgcgcagc 


cttcgggagc 


gaggcgtgta 


514 80 V 


cctggtagca 


ggagggctgg 


gtggaatcgg 


cctggtgctg 


gcgcgagcgc 


tggcccagcg 


51540 


ggcgcgtgct 


cggctggcgc 


tactcaccca 


ctcgcccttc 


cctccccgag 


agcagtggga 


51600 


gcagtggctg 


gaggaagccc 


cggcgcaccc 


ggagccggcg 


tggcggagcg 


aggccgaccc 


51660 


ctcggagcgc 


cgcaggaccc 


agcaccgcat 


ccgctgcctg 


ctggagctgg 


agcagetcgg 


51720 


cgccgaggtg 


caggtgtaca 


cggcggacgt 


ggcggaggag 


gccgccgtgc 


gctcggtggt 


51780 


ggagcaggtg 


cacgcccgct 


gggggaagat 


ccacggcgtg 


ctgcacgccg 


ccgccacgtt 


51840 


cgacgacggc 


gtcatccagc 


tccgcacgca 


cgagcagtcc 


tcgcgggccc 


tgcgcaccaa 


51900 


ggtgcggggc 


agcatggtgc 


tgcacgaggt 


gctggcgagc 

< 


gaggggttgg 


attggttcgc 


51960 


cctgtgctcc 


tcgctggcgt 


cggcgctggg 


ctcattcggc 


caggcggact 


actgcgcggc 


52020 


caatgccttc 


caggatgcgt 


atgcgcacca 


cctgcgccgg 


cagggcttca 


cgggagcgct 


52080 


ggcgctggac 


tggggcacgt 


ggagagatac 


gggggcggcc 


atgcggctgg 


tggcacgcac 


52140 


ccgacggggg 


ggccatgaga 


agccgcccac 


gccgctcacc 


cacccactct 


tcgattgcga 


52200 


acagcgcgag 


ccgggcggga 


cgcactggct 


cggcctcacg 


ctgaggggtg 


gagaggactg 


52260 


ggtggtggac 


gagcaccggc 


tgcaaggggt 


gccaacactg 


cccggggtgg 


cctacctgga 


52320 


gctggcgcgg 


gcggcgtgtg 


cccaggcgct 


gggggccgag 


9 c ggtggagc 


tggcggagct 


52380 
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gttgctgctg 


gagcctctga 


cggtacctcg 


aggcgaatcc 


aggcaggtcc 


ggatggtgct . 


52440 


ccagcccgag 


gggcaggctc 


atgccctgcg 


ggtggagagc 


cggtcggagg 


aagcgcgggg 


52500 


atggaatgag 


catgcgcggg 


gccgggtgcg 


cgccgtgcct 


cggctggccg 


agcgcatcca 


52560 


gcccgagctg 


ctgcgcgccg 


cctgcgaaca 


cgagcagccc 


gtgcccggag 


agccccagga 


52620 


gcaaggccct 


gtccacgccg 


gagcacgctg 


gcatggcctc 


ttccagtggg 


ttcgccgcgg 


52680 


ccctcgccag 


gccctcgccc 


agctcgcgct 


accggagccc 


ttccacggtg 


acctcgagcg 


52740 : 


cttcgagctc 


cacccggcgc 


tcatggacat 


ggccaccagc 


ttcgccattc 


ccggcggagt 


52800 


gccctggctc 


gcctttggct 


atgagcgcgt 


gctcattcac 


ggtccgctgc 


caccgcaggt 


528 60 


gctcagccac 


gtgagcctgc 


ccgaggagtc 


gcaggctggc 


gcgcaacaac 


tccggctaca 


52920 


ggtgcggctg 


ctggatctgg 


agggctggga 


gcgggtgcgg 


atcgatgggt 


acctgctgcg 


52980 


gccgctgaag 


cccagcgacg 


ccagtgtcga 


gccggcggcg 


cccaacgtgg 


aagtcgccgt 


53040 


ggggacgccg 


gggctgctgg 


agagccttgg 


cctgcgccgc 


tgcacccgcc 


ccgcccccgg 


53100 


gccgcgccag 


gtggagatcg 


aggtggaggc 


cgctgggctc 


aacttcctgg 


acgtgctggg 


53160 


cgcgctgggg 


atgatgccgg 


cattggaggc 


ggaggagagc 


gtactggggc 


gcgagtgctc 


53220 


cggacgcatt 


gccgccgtgg 


gcgagggcgt 


cagcgggctg 


cgcgtggggg 


acgaggtgct 


53280 


ggcggtggcc 


ccaggctgct 


tccgctccta 


cgtgcrtggtg 


gatgagagcc 


aggtggtgcg 


53340 


caggcccgcc 


tcgctggggc 


tcgccgaggg 


ggcggcccag 


atggtgccgt 


tcgccacggc 


53400 


gtacttcgcc 


ctgcacaccg 


tgggccggtt 


gcggcgcggc 


gagcgcatcc 


tcatccacgc 


53460 


cgcggccgga 


gggctgggtc 


tggccgccgt 


tcagctcgca 


tcccggaccg 


gggcggagat 


53520 


attggccacc 


gcgggcagtg 


agcagaagcg 


cgagtacctg 


cgctcgctcg 


gcattgctca 


53580 


cgtgctggac 


tcgcgcagca 


cctccttcgt 


cagcgaagtg 


cgcgagcgca 


ccggcgggcg 


53640 


tggggtggat 


gtggtgctca 


actcgctggc 


gggagagctg 


ctcctggcgg 


gcctgtccgt 


53700 


gctggccccg 


cacggccgct 


tcctggagct 


ggggaagagg 


gacctgtatg 


cggaccagca 


53760 


ggtgggcctc 


cgaaccctgg 


cccgagggca 


gactttcgcc 


gccattgact 


tcggtcccca 


53820 


ccacccggac 


ttccgagcgg tgctcgagga 


ggtggccacg 


caactcaccc 


agggccagct 


53880 


cgagccattg 


cccacccgcc tcttccccgc 


gcggcaggtg 


gccgaagcct 


tcagcttcat 


53940 


ggcccgcgcg 


ctgcacatcg 


gtcgcgtcgc 


cgtctccatg 


cagggggcga 


cggcattgcc 


54000 


cgcgtccatg 


actcggggct 


ccaggcccgc 


accggtggcc 


gtacctcctt 


gggaggaccc 


54060 


gcggctggcg 


ggcggcatct 


cctctgaaga 


gggtgcggag 


gccttcctgc 


gcgcgttgga 


54120 


gcaaggggca 


ccgcagctca 


tcatctcccc 


ccaggacttc 


agctcgctgc 


tgcgcggcct 


54180 


gggcggcagc 


cagggcgtgc 


gcgaaaagga 


gcgcctcgtc 


accgggcgcg 


ccgccgccgc 


54240 


cgagccgcag 


gccttgccac 


cctcctcgct 


ggagcagctc 


atcgagcagg 


tgtggcgcaa 


54300 
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gcacctgggt gtggagcgcg tgcagcccac ggacagcttc ttccagcttg gaggagactc 54360 

gctgctgggc atccaagtgg cggcggatct. ccgcaggcac ctgggtgtgg agctgcccac 54420 

ggccaccctc ttcagccacc ccaccctcgc cgcgctggcc gcggctctgc gggctcgaca 544 80 

gggtgaggcc gcggctccca ctgcccccgc gccagcgctc gtgccggatc cagccgcgcg 54540 

cttcgagcct ttccccctca cggatgtgca ggaagcctac tgggtgggtc gccgctcggc 54600 

cttcgagctc ggcggcgtcg ccgcccatgg ctacttcgaa atcgaaagcc cggggctgga 54660 

ggtggagcgc ttcatccaat gctggcgcca gctcctgcag cgccacgaca tgctgcgcat 54720 

ggtggtgctc ccggatgggc ggcagcaggt: gctcgagcag gtgccggagt acacgccgga 54780 

ggtggtggag ctgcgggggc tctcccccca ggaggccgag tcccgccggc tccagctgcg 54840 

tgagcgcatg gcccaccagg tcctgcgcag cgaccgctgg ccgctcttcg agctggtgct 54900 

ctgccggtac gagggaggcg tccgcatcca catgagcatg gatgccctga tgctggatgc 54960 

gtggagttca gcggtgcttc ggcaggactt cgcccagctg taccacgagc cgggccggcc 55020 

gctggagccg ctggccatca ccttccgcga ctacgtgctg gcggagcgcc ggctgcgcga 55080 

gggcgaggcc catgagcgcg cccgcgcata ctggtgggct cggctggaca cgctgccgcc 55140 

accgcccgag ctgcccctgg tgaaggaacc ctcgcagctg gagcacgcgc ggttcaccca 55200 

ccgcgaggct cggctcgagc cacaccgctg ggcccggctc caggagcggg cgcgcgccca 55260 ^ 

cggcctcacc ccctcggccg cctgcatggc cgccttcgcc gaggtgcttg cccgctggag 55320 

ccgtcacccg cgcttcaccc tcaacctcac cctcttccag cgcttgcccc tgcacccgca 55380 

ggtggacgag ctggtgggcg acttcacctc cctggtcctg ctggaggtag aggcacacgc 55440 

ggcgagcacc ttcgccgagc gtgcctcccg gctccaggca cagctatggc gggapctgga 55500 

gcacggcagc gtgagcgccg tgcagctcat ccgcgagctc gtccgcaccg gccgccgctc 55560 

cccgggcgcc atcatgcccg tcgtcttcac cagcatcctc agcctggatg cgcggcgcgg 55620 

cccccagggc agcctctcct tcttcgaggg agaactggtg tacagcatca gccagactcc 55680 

ccaggtgtgg ctggaccacg gagtccacga ggaggagggg gcgctcgtcc tggcgtggga 55740 

ctcggtggag gcgctcttcc ctccgggcat ggtggacgac atgttccacg cctaccagcg 55800 

gctgctgggg gcactcgccg aggaggagca agcgtgggag ggcgagctgc cggagctgct 55860 

gcctcctgcc cagcgtgagt tgctcgcgcg ctacaacgcc acccaggcgc cgcggcccag 55920 

cggacggctg gaggagggct tcttcaccca ggcgcggctc caccccgagc tccccgcgct 55980 

gctcgcaccg gagcgcaccc tgagctacgg cgagctggca aggcgagccc aggcgctggc 56040 

cgcgcgccta cgcgagctgg aggtgcagcc tcaggagttg gtggccattg ccatgcacaa 56100 

gggctgggag caggccaccg ccgtgctcgg cgtgctgcag gcggccgcgg cctacctgcc 56160 
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gttggatcca 


gagcagccgc cgctccggct 


ccaccagctc 


ctggaggagg 


ggcccgcccg- 


56220 


cgtggtgctc 


acccagtcct 


ccttgctgca 


caccgtgccc 


tggccgccgg 


gtgtgcaggt 


56280 


gatcgccgtg 


gacgaactcg 


agcctgcaac 


cgaggccccc 


ccgctaccgc 


ctcgcggtac 


56340 


accggagcac 


ctcgcctacg tcatctatac 


ctccggctcc 


accggcaaac 


ccaagggtgt 


5 64 00 


ggccattgaa 


caccgggccg 


cgctcaacac 


cgtggtggac 


ctcaacaccc 


gctttggcgt 


56460 


cggcccggag 


gatcgggtgc 


tgggcctgtc 


cgcgctcacc 


tticgacctgt 


cggtgtacga 


56520 • 


cgtgctgggg 


ctgctcggcg 


cgggcggagc 


gctggtgctg 


cccgcggcgg 


aggcggagaa 


56580 


ggat cccgcc 


cactggtggg 


agcggctggt 


ggctgggcgg 


gtcacggtgt 


ggaactccac 


56640 


cccggcgctg 


atgctgctgc 


tggtggagta 


cgccgagcag 


cgcgggctga 


agctgcccgc 


56700 


ggcgctgcgc 


ctggtcatgc tcagcggcga 


ctggatcccc 


gtggcgctac 


cggatcgcat 


56760 


ccgcgcactc 


ggcagggacg 


tgcaggtggt 


gagcctggga 


ggcgccaccg 


aggcttccat 


56820 


ctggtccatt 


gcctacccca 


ttggccaggt 


ggcaccgcag 


tggaagagca 


ttccctatgg 


56880 


ca ugccgcug 


gccaatcagc 


gattccacgt 


gctggacggg 


cggctggagg 


cacggccctg 


56940 


gtgggtgccg 


ggcgagctgt 


acattggcgg 


cgaggggctg 


gcacgcgagt 


actggaggga 


57000 


tgagccgctc 


accgcaacgc 


gcttcatccg 


tcacccgcgc 


acaggcgagc 


ggctgtaccg 


57060 


caccggggaC 


caagggcgca 


tgctgcccga 


agggagcatc 


gagttcctcg 


gccgggagga 


57120 


t ctgcaggt c 


aaggtgcagg 


gcttccgcgt 


ggagctgggg 


gagattgaag 


cggcgctggc 


57180 


ccagcacccg 


gcgctatcgg 


cgagcgtggt 


ggtggcacga 


ggagagcctc 


ggggagtgcg 


57240 


gcggc uy g ug 


gcctacgcgg 


ttcctcgctc 


gggtcagacg 


cccgcggcag 


gcgagctgcg 


57300 


ccgctacctg 


gcggagcggc 


tacccgcgta 


catggtgccc 


tccgccttcg 


tcctcctgga 


57360 


gt ccctgccc 


cgcagccgca 


acgggaagat 


cgcccgagat 


cagctccccg 


agccgcagca 


57420 


gacacaggga 


ctggctgcac 


aggccgcggc 


ggccgacccg 


ctcgtggagc 


ggctggcagc 


57480 




gaggcgctga 


ggctcgagcg 


cgtggagccc 


caggacagcc 


tgctggacct 


57540 




tcggtggcgc tcatccgcct 


catcaaccgc 


ctggaggcag 


agctgcagtt 


57600 


ccgcccg cga 


ctggccgaca tctacgagaa 


ccccaccgtg 


caggggctcg 


ccacgctcca 


57660 


ccaagagaag 


acaaagagcc 


agggagaggg 


aggcgctccg 


cggctcacgg 


cgccccgctc 


57720 


cacgcttctg 


cccgccgagg 


agtgggggcg 


cttcaaggcc 


aaccgcccgg 


gcctgcgccg 


57780 


cttccccgai. 


ggaacgcctg 


aggtggcact 


gccaggcagc 


ggcttggcgc 


cggcccccga 


57840 


ggag ctgaca 


gctctcgagc 


gccgccgcag 


tgtgcgcacc 


tactccctcg 


agcccgtgag 


57900 


ccatgagcag 


ttgggacggc 


tgctggcccc 


cttgcgcgag 


tgggaqgtgc 


agggctcgcg 


57960 


gcgttacctc 


tacgcctccg 


cgggcgggct 


ctacccggtg 


cagctctacc 


tccacctcaa 


58020 


gcccggccgg 


gcgcgagggc 


tcgagcccgg 


cacctggtat 


tacgatccca 


gcacccatcg 


58080 
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gctggtgctc ctgtccgccg gagccgggct ggatcgccgc atccatgatc cgcaccagaa 58140 

ccaggccatc ttcgactcgg ccgcgttctc cctcttcctc atcgcccgca tgggggccgt 58200 

ggagccggta tacgccgaac atgccctgca cttcgccacg ctggaggcag ggctgatgac 58260 

ccagcttctc gatctgggcg cggctcccag tgggctgggg ctgtgccata tcggcgacct 58320 

ggacttcgcc caggcgcggg ggctcttcca cttggaggag gagcacgtgc tgctgcacag 58380 

cctggtgggc ggagtactcc ccactcgggg gcaggaggcg gcctcggtgc ccgctgaggg 58440 

aggaacggag gcgcggcaac tggcgcagct cctgcaacag gtgaagacgc tcacgcccga 58500 

ggccgcgcga gcgctgctcg aggcccgccg cggcagcaag gggagaccac atgagtaagc 58560 

tgcacgagga gctggagagc ctggcgccgg agcagcggga gctactcgcg gccctgatga 58620 

aagagcaggg cctggacgag ggcgcattgc tgatgcccgt ggagcgcaag cccgaggggc 58680 

tgccgctctc gtccgcccag cagcgcatgt ggttcctgca acagctcagg cctacgagcc 58740 

ccttctacaa cgtgcacgcg gcgctccggc tcacgggaaa gctgaaggtg gagtgcctgg 58800 

tgcacagcct gaatgagttc gtccggcgtc acgagccgct gcgcacggtg ttcccctccg 58860 

ccggaggtca acccctgcag cgcatcctcg cgcccgcacc ggctgcgctc gagcagcgcg 58920 

acctgagcgg cgtgcccgcc caggagcgag aggccgaggt gtaccgcgcg gtggagcacg 58980 

cagcgctcgc ctcctttgat ctggagcgag agccgccgtg ccgcttcctc ctggtgcgag 59040 

tggagccgga ggaacacgtg ctggtgttcg ccacgcacca catcgcagcg gatggctggt 59100 

cgctcggcgt cttcgtgcag gagctgtgcg cgctgtacac ggctgctgta cacgcggagc 59160 

caccggcgct gccaccgctg cggctgcagt acgcggactt cgccgcgtgg gagcggagcc 59220 

ggctcaaggg tgggcgcgag cgcgagctgc tcgagtactg gcaggagcag ctggeagggc 59280 

tgccggacct gagcaccctg ccgccagagc ggcccaggcc cccgctgtcc aagcaggagg 59340 

gcgccacgtt cgaattcgcc ctgccaccac accaggtgca ggccctgcgc tcacttgctc 59400 

aagcgcggcg cacctcgctc ttctccgtgc tgctcgccgc cttccaatgg ctgctggccc 594 60 

ggtgcgccgg ccaggacgac gtggccctgg gcatgcccat cgccaaccgc aaccgcaagg 59520 

agctggaagg cctcatcggc tgcttcgcca gtaccctggt gctgcgcgcg aagccctccg 59580 

cctcgaccgc cttcacctca tggctcgccc aggtgtccga gcagctccac ggcgccctcg 59640 

agcaccagga ggtgcctttc gaacgattgg tggaggtgct ccagccccgg cgccgcatgg 59700 

atcggcaccc gctcttccag atcttcctcg ccatgcagca gcacccgctg cggcgcgccg 59760 

agctgccagg cctgctgctc tcggagttcc cccttcgcag ccgcgtggcc cgcttcgatc 59820 

tggagttcca cctctgggag tctgcccagg gcgtcgaggg caccctcatc tacgacgtgg 59880 

acctgtatgg ccaggagggc gtagcgcaac tggtgcggcg ctacgtgagc ctgctcgaag 59940 
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ccgtggcggc ggacccgacg cggacactgg gggagctggc gggtgagacg ctggccccgc _ 60000 
ccgtacggaa gcaggttctc gccctgtcgg agtgtccgcc cctcccacgc ccgagcacag 60060 
cccctcggac actggccgag gcacttctac agaccgccga gcgcttcccc acggccacgg 60120 
tcagcttcgt ccaggcacag ggctcttgca cggcctggac tctgccagag ctggtggagc 60180 
gggcccggcg cctgcaggcc ggcttgcggc agtggggatt gcggccgggc gacagtctgg 60240 
tgctggtgct ggggagggag gaagagacgg tagaggcact ctgggcctgc gtgctggcgg 60300 
gagtggcgcc cctggtgcta ccggcgccgc ccgcgagagc ggaggcgagt cccgcgctct 60360 
cacgtctgcg gcatgcccgg cagctgctgg gtgggccccg ggtcctcacc cggcaggaga 60420 
tgctgcccga tcttgccagg cagcttcagg tctcgcccac cgccgacatc ctgggggccg 60480 
tggaggagct gagagccacg ggtggcgagg cgcccctgcc cccagggcgc atggatgacg 60540 
tggccctgct caacctcacc tcgggcacca ccggcaaggc caagtgcgcc atgctcacgc 60600 
accgcaacct gctggtgcgc ctggaggcca ccaacgtcgt ctacgagtcc cagccgctcg 60660 
agcgcggcct cgtctggttg cagctgcaca acattggcgc cctgtccgag taccacctcc 60720 
gcccgctctg cgccggcatg cacaccttcc acgctcccac cgaggaggtg ctcgccgagc 607 80 
ccctgcgatg gctggagtgg ctcgagcggt atggcattgc acagacgtgg gcgcccagct 60840 
tcgcctacag ccacctgctg gagcggctgc gcaaggtgga ggaccggcgc tggagcctgg 60900 
gaggcgtgcg cgtgctgctc agcgccggag agcagatctc cgcgcccatg gtggaggagc 60960 
tgatgcggag gttggctccc tcgggagtgc gggaggatgc cttcgtcgct gcctggggaa 61020 
tgaccgagac ggcttcgggg gtgacctatg cgcggcggcc cggaacgccg ccccgcatgc 6108 0 
acaccctgga gcgcgcgagc ttgagcggtc cgcttcggca cgcggcaccc gcttcgccca 61140 
ccgcgctgcg gctgatggat gtaggagccc ccattgccgg caccgccctg cgggtggtgg 61200 
acgcgagcgg cgagctgctc tccgaggagt gcgtggggcg cattcaagtg cgcggcgaga 61260 
tgatctctcc cggctactac ggggacccga aggcctcggc ggcgctgctc accgccgacg 6132 0^ 
gctggctgga gacaggcgat ctgggcttcc tctccgaggg agcgctgacc attaccggcc 61380 
gcgccaagga tctggtcatc atccacggca ccaacttctc ctgctacgag atcgagtccg 61440 
cggtggagca ggtggaggga gtggcgccct cctcggcggc ggcggcggcg gtgcggatgc 61500 
tcgaggggag cagggaggag ctggcggtct tcttcgtgcc cacggaggga ctcgctccgc 61560 
aaccccctgc ctcactcctg tcgcgcatcc gccagcaggt gctcgagcag gtgggggtgc 61620 
ggatcgatca tctcatcccg ctcgagcctc accagctccc acgcacggag ggaggcaagc 61680 
tgcgccgctc ggagctgagg gcgcgcttcg aagcaggtga gctgagggcg ccgcaacccg 61740 
ctccggtccc gagcccctcg cgcccgctgg agcagctcat cgcctccgtc tgggcggagg 61800 
tgctcgagca ccaggacatc gcgcccgagg ccagcttctt cgacctgggc ggcaactcca 61860 
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tcctcctggt gcgcgtggag cgggcactgc gcgcgcggct cggcctggag ctgacgctca 61920 
tggacctgtt cgcctacccc acggtgcact cgctggcgga ctacctggag cctcgagccg 61980 
cccagctgcc agcacaggcc tcccctccca cgcaggccga gcgccggcgg gggatgcgcg 62040 
gcgcggcgct ggagcagaga cgcactcgcc gccaggcaca acgggacgag gactagacac 62100 
gcatgagcca cgacacgcag ctcgagggag ccgtagcggt agtggccatg gcggggcgct 62160 
tcccccaggc ccccaccctg gaggactact ggcgcatcat ccacgagggc gtggacgcct 62220 
ttacccagct cacggacgaa cagctcctgg cctccggagt ggggccctcg ctcctgcgcc 62280 
aacccggtta cgtgcggcgc gccgccctgc tggacaggat ggaccagttc gacgccgcgt 62340 
tctttggctt ctccccgcga gaggcggagg tgctcgaccc acagcaccgg ctcttcctgg 62 4 00 
agtgcgcgca cgaggcgctg gagcgggccg gccatggctc cgagcgcgca agggggcgcg 62460 
tgggggtctt cgccagcgcc agcctcaaca gctactacct gcattccctg cacgggaacg 62520 
cccggctgag ggaggtgctg ggagacttcc agctcgccat cgccaacgac aagga<rttcc 62580 
tgcccacccg cgtctcgtac aagctgggcc tgcgcgggcc cagcgtggcg gtgcagacgg 62 64 0 
catgctccag ctcgctggtg gccgtccacc tcgcgtgcca gagcctgctc aatggtgagt 62700 
gcgccctggc gctcgcgggc ggctcctctc tctccgtgcc ccaggcccag ggctacctct 62760 
accaggaggg aggcattgcc tcaccggacg ggtactgccg ccccttcgac gcggcggcgg 62820 ~ 
cgggcaccaa ccgaggcaac ggcgtggggg tggtgctgct caagctgctc gaggaggcgc 62880 
tggcggacgg agacaccatc cacgccgtca tccgcggctc ggcggtgaac aacgacgggg 62940 
cacacaagat cggctacacc gcgccaagcg tggaggggca ggcctcggtc atctccgagg 63000 
cgctggaggt ggcggccgtc tccgcggaca gcatcggcta cgtggaggca cacggcaccg 63060 
ccacggccct gggagatccg atcgaggtcc aggccctcac gcgggccttc cgcaagcaca 63120 
cggagcgccg cggctactgc gctctcggct cggtcaaggc caacatcgga cacctggatg 6318 0 
cggcagcggg catcgccagc ctgatcaagg ccgtgctggt gctggagcgc cgccagctcc 6324 0 
cgccatgccc gcacttcacc tcccccaacc cacgcatcga cttcgagcgc agccccttct 63300 
acgtgagcgg gcgggggcag ccgtgggagc cggtggacgg cccgcggcgc gcgggcgtca 63360 
gctccttcgg tattggtggc accaacgtgc atgtggtgct ggaggaggcg ccgccccggc 63420 
cggcgccgcg gcgggcagcg cggccctacc agctcctgcc gctgtcagca cgcacggagc 63480 
gcgcccggga ggaggtcgag gcccggctgc gcgagcacct gcgccagcag ccccaggagc 6354 0 
cgctggagga ggtggcccac acgctccagg taggccgccg ccacatggcc tggcgcacag 63600 
cgctggtgag cagcagccct gcccaggcgg tagagctgct ggagaggcgc cgacccgagg 63660 
cgctgctgcg tggccagagt gcggcccagg cccgctccgt ggccttcctt ctaccgggcc 63720 



# • 



35/38 



agggctcaca 


gtacgtgggc 


atgggagcgg 


cgctccatga 


gtccgaggcg 


cccttccgtg 


63780 


aacaggtgga 


tctctgtgcc 


gggaaactcc 


agggcgtgct 


cgggttggac 


gtgcgccgec: 


63840 


tgctgtaccc 


tggcccgcgg 


gagcgggaat 


gggcccagga 


gcgcctgcgg 


gagacgcggg 


63900 


tatgccagcc 


ggtgctcttc 


accgtggagt 


acgcgctggc 


ccgactgctg 


gaggcctggg 


63960 
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64020 
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ctccctggaa 


gaggcgctgg 


aggtggtggc 


cgcacgtgga 


cagctcatgg 


64080 


gcagcatgcc 


cccggggggc 


atgctcgccg 


tggggctccc 


agcccaggaa 


gtggaaccgc 


64140 


tectacccgc 


ggcactggcc 


ctggccgcgc 


acaacagccc 


ccaggcctgt 


gtggtggcgg 


64200 


gccccaccga 


gcccctggcc 


gagctgcgcg 


cacgactcga 


gcagcggggc 


atcgcgtgca 


64260 


cgcctctggc 


tgtctctcac 


gccttccact 


cgccgatgat 


ggagccggcg 


gtggccccat 


64320 


tcgtcgcccg 


gctgcgccgg 


atgcatctgc 


ggcctccgag 


cctgcccttc 


atctccaatg 


64380 


tgactggcac 


ctggatagag 


gccgaggagg 


cgacctcacc 


ggagtactgg 


ggccggcacc 


64440 


tgctgcagcc 


ggtgcgcttt 


gcccaggggc 


tggagcggtt 


gtgcgagggt 


gtgcagccgc 


64500 


ggctgctgtt 


ggaagtgggg 


ccgggccaca 


cactggggcg 


gctggcggcg 


cgccaaagct 


64560 


ccggccccgt 


gcaggtggtg 


tccacgctgg 


gctccagccg 


ggaggaaagc 


tcggaggtgg 


64620 


agcggctgct 


gacggcaatc 


gggcgactgt 


gggtggaggg 


agccgaggtg 


gactgggctg 


64680 


ggctccaccg 


cggcgaacgc 


cggaggcgcg 


cggtgctacc 


cacctaccct 


tttgagcacc 


64740 


agcgctactg 


ggtggagaca 


gccccccagc 


cttcccctcc 
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gggacacctg 
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ccgagagccc 


tgtcaccagc 


agcttctacg 


tgccaggttg 


gagccgcgcg 


gctctgccct 


64860 


cggcggcccc 


ctcgagacgg 


gtgggccggc 


tgctgttgtt 


ggcggaggcc 


catgggtgga 


64920 


gccaggggct 


cgcggagcgg 


ctccgggccc 


ggggacactc 
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64980 
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acttccaacg 
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gactccggag 
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gagggtgctc 


cacctctggc 


65100 


tgctggggag 


cagccagagc 


ccccaggagc 


gcggcttcta 


caccctgctg 


gcgctggccc 


65160 


aggcactggg 


agcccacggc 


acccggcccg 


cggtggagct 


cacggtggtg 


accgatcagc 


65220 


tctacgcggt 


ggcagagggc 


gagccgatac 


agccgctcaa 


ggcgctcctg 


cagggccctg 


65280 


cttccgtgct 


tccccaggaa 


ctccccgggt 


gcacgtgccg 


cctcgtggac 


atggccctgc 


65340 


cgccaggcgg 


cgtggcggag 


gagctgctgg 


agcggctggt 


ggcggaggtg 


gagtccaccg 


65400 


cgtccgaacg 


ctcggtggcg 


taccgcggcg 


cggctcgctg 


ggtgcgcgag 


ttcgtccccg 


65460 


tgccgctgcc 


cccgcccgag 


ccttcgcagc 


tcccgcttcg 


gcagagaggg 


gtgtatttga 


65520 


ttgtcggcgg 


cctggggggc 


gtagggctcg 


cgctggcaga 


gcacctggcg 


cggcgcgtgt 


65580 


cggcgcggct 


ggtgctcacg 


ggccgctcgc 


ccacgccacc 


gcgcgagagc 


tggagcgcat 


65640 
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gtggaggtgg 


actcgttggc 


tcggccacag 


cccgctggca 


68160 


aggctccgcg 


ccaggcagtg 


cttccacgac 


caggcgcgct 


cgactcgctg 


cgactgcaac 


68220 


ccctggagcg 


ccttccgccg 


caggagggag 


aggtggaggt 


gcaggtgctc 


gccgcgggcc 


68280 


tcaatttcaa 


ggacgcgctg 


ctggcgctgg 


gggcgttgcc 


agtggagctg 


gccaacggcg 


68340 


ccccactggc 


gctgggagtc 


gagtgcgcgg 


gcatcatctc 


cgcggtaggt 


ccaggagtga 


684 00 


gaggcctgcg 


agtgggcgag 


gcggtggtgg 


ccgcggcagc 


aggagccttc 


gcctcgcatg 


68460 


tgcgagtccc 


ccaggagcag 


gtcttcccca 


agccagcggg 


cctgagcttc 


gagcaggcgg 


68520 


cgatggtgcc 


cgtcactctg 


ttcaccgcct 


ggtatgccct 


ggaggagctg 


gcgcggctgc 


68580 


gcgcgggaga 


gcacgtcctc 


atccacgccg 


cggccacggg 


ggtgggactg 


gcgggggtga 


68640 


agttggcgct 


gcggcggggc 


gccacggtgt 


acgccaccgc 


gggcagcgag 


ccgaagcgcg 


68700 


agctgctgcg 


ctccctgggg 


gtaacgctgg 


ccatggactc 


gcgcgcgccc 


gggtttgacg 


68760 


accagcttct 


gcaacacacc 


caggggcgag 


gcgtggacgt 


ggtgctcaac 


tcgctgagcg 


68820 


gcgagttcct 


ctcccgcagc 


ctgggcgtgc 


tcgctcgcca 


cgggcgcttc 


gtcgagctgg 


68880 


gtgtaaggga 


catgctctct 


ggcggcacgc 


tgccgctggc 


tcccttcgag 


cgcgggctca 


68940 


ccttcctcgc 


ggcgcagata 


gacccgggga 


tgaagggcta 


ccgggagctg 


atgggcgagg 


69000 


ccctgcggca 


gatcgagcgc 


ggagagctgg 


agccgctgcc 


ctacacggca 


tggccactgg 


69060 


agcgcgtggc 


cgaggcgctc 


cagctcgtct 


ccaagggcag 


gcacgtaggc 


aaggtggtgc 


69120 


tcaccccgga 


agagcccttg 


tcacggccgc 


cagcgctccc 


gagctcctca 


aggccagtgc 


69180 


aaccccgggc 


aqqcqtqqcq 


attqtcqqqc 


tgcgctccgc 


cgagggct gc 


aaaaccttco 


69240 


agcgcatcct 


cgcggccggc 


ctgccgcagg 


tggccgtctc 


cacccgtgag 


ctgcgcgcgc 


69300 


gcatggcgga 


gatcgagcgc 


ctgcgcgtct 


cctcctggga 


gccggcgctt 


ccctcggtgc 


69360 


cccgcggctc 


ccccgccagg 


accgaacgct 


ccaagcccta 


tgttgctcct 


cgcaccgagc 


69420 
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qcqagcgcgc 


cctggccgcg 


ctctggcagg 


acctgctcgg 


cgtctccgag 


gtggggttgg 


69480 


atgatgactt 


cttcgagctg 


aaaggggact 


cgctgctcgc 


catccagctc atggggcggt 


69540 


tgcgcaagga 


gctggaggtg 


gaattgccac 


tctcctcctt 


cctcgcccgc 


cctacgctgc 


69600 


gcacactgct 


ctccgccatg 


ccagccccgg 


caacggacga 


gcctgcctcg 


gccaccgggg 


69660 


caatcccagc 


cgccgctccc 


cagccgtcac 


cggctgtctc 


cagcgaaccc 


gctcggaagt 


69720 


ggcgccacct 


ggtgcccatc 


caacctcagg 


gcgagagccc 


tcccttcttc 


tgggctgcgc 


69780 


cgctgatggg 


caccgtgttt 


ccctacttca 


cgctggcccg 


ctgcctggcg 


cccacccacc 


69840 


ccttctatgc 


tctccagccg 


ccagggttgc 


aggaggggca 


ggagcccatg 


gacaaggtgg 


69900 


aggaactggc 


ggccctgtac 


gtgcgcgagc 


tgagagagct 


gcagccgcga 


gggccctacc 


69960 


gcctgggagg 


ctggtccttc 


ggctgcgtgg 


tggcttatga 


ggttgcccta 


cagctcgagg 


70020 


cggctggaga 


gcaggtggcg 


ctgctgagcc 


tgctggactt 


ccctgcccct 


tcgggccagc 


70080 


gagccagtct 


ctgggcgacg 


gcccgcttct 


tcagcggctc 


ggtgctgcgc 


ggcctggcgc 


70140 


cctatacgct 


cgactatctc 


tacctggcgg 


ctcgcgctcc 


tctgaatcca 


gacgctgcct 


70200 


cgcgcctgag 


cagctccctg 


acccgaggat 


gggagcgcct 


gcggaaagga 


gggctggtgc 


70260 


aggaactgct 


ggaccatgcc 


gccatggccc 


gggtggtgcc 


tgaggactca 


cggctgctgc 


70320 


tgctgcgaga 


gcctggcatt 


gcccccatgt 


tgaggctgac 


ccgggctcac 


cagcgagcca 


70380 


tgctctccta 


tcggccccga 


ggtcgcctcc 


gccagcgcat 


cgtcctcttc 


cgcacctccg 


70440 


agcaggcctg 


gagcttcgcg 


cgagacctgg 


gctggggagc 


cctcagcgcc 


tcgggcgtgg 


70500 


atgt gcgcga 


ggcgccggga 


gaccatatga 


cgctgctgcg 


gccacctcac 


gtggagcggg 
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tggcagagca 


gctccgggcc 


ctgctcagct 


ccgcgcctct 


cccgactcgc 


cgctgagttc 


70620 


gggctgcgcg 


ccagaggctg 


cctcatgcat 


gccctttggc 


agccagcccg 


agctgtccac 


70680 


ccactccagc 


gcctcgctca 


gatcgtgctt 


ttcgacgatc 


tgatccaagg 


tgaccacctg 


70740 


cgcttccacg 


ctgttgccca 


gatgagaggg 


cacccgcgga 


tc 




70782 



